DeepSeek融资传闻:全栈可控的定价锚测试
2026年5月,国内大模型行业的舆论焦点被一组未经官方证实的三手传闻点燃:成立以来始终坚持「不融资、不商业化、不公开路演」的DeepSeek,被传启动首轮外部融资,目标募资500亿元人民币,对应投后估值约3500亿元[1]。这组传闻中的数字不仅被认为将刷新中国AI行业单轮融资的历史纪录,更暗藏一个此前从未被市场作为核心定价依据的逻辑:这是国内大模型估值首次脱离互联网生态绑定的旧框架,转向「国产算力+大模型全栈可控」的新叙事——只是这个新叙事目前仍处于测试阶段,从核心事实到技术支撑再到商业闭环,均存在明确的可验证边界。
多份三手传闻提及,本次融资的核心设计围绕「保障全栈可控路线的长期独立性」展开,这也是当前叙事中共识度较高的底层逻辑。传闻称创始人梁文锋拟通过股权重构将直接持股比例从1%提升至34%,加上通过关联主体持有的股份,合计控制84.29%的表决权[2],并拟个人出资200亿元占本轮募资额的40%,成为最大单一出资方[4]。传闻进一步提及,这一设计直接排除了外部资本干预技术路线的可能:不仅拒绝了阿里提出的深度生态绑定诉求,更将腾讯的投资限制在2%左右的纯财务份额,明确划清「资本只提供资金、不干预技术决策」的红线[5][9]。本质上,梁文锋被认为是用个人财富置换了长期技术研发的决策权,避免了多数AI创业公司为满足短期资本回报要求,压缩基础研发投入的通病。
多份三手传闻提及,本轮募资中超过60%即300亿元将定向用于智算集群建设和国产AI芯片采购,核心标的为华为昇腾系列芯片[5][6]。DeepSeek此前公开宣称V4模型已完成从英伟达CUDA生态向华为CANN架构的迁移,试图将算法层面已验证的推理优势,转化为基于国产硬件的全链路成本优势,但该迁移尚未发布第三方独立验证的端到端训练benchmark数据[5]。传闻中的估值跳涨节奏也被市场解读为定价锚转移的信号:从4月初的100亿美元,到4月底腾讯、阿里入局洽谈后的200亿美元,再到5月国家大基金领投传闻传出后的515亿美元(约3500亿元人民币),21天内415%的涨幅没有任何公开的商业化数据支撑,完全由「国产替代+国资背书」的叙事驱动[9]。
技术端的可验证证据,为这个新定价锚提供了有限但扎实的基础。目前唯一经过第三方独立复现的技术优势是:DeepSeek-V4基座模型已按MIT协议全量开源,在相同参数、相同推理硬件条件下,其70B模型的端到端推理延迟较Llama 3-70B低18%,128万长度上下文的召回率稳定在85%以上,算法层面的推理优化确实具备可复现的优势[3]。融资传闻传出后,A股国产AI芯片标的出现普遍上涨、第三方算力租赁板块集体调整的行情;需注意的是,A股股价波动或受多重市场因素影响,相关走势或与「头部大模型自建国产算力集群」的产业叙事存在关联,但尚无直接证据证实二者的因果对应关系[6]。与此同时,国内大模型行业的路线分野也逐渐清晰:智谱、MiniMax等玩家选择绑定互联网巨头获取流量与客户资源,而DeepSeek则走出了「国资背书+自主技术+开源生态」的独立路线,其核心差异化价值就是不被互联网生态绑定的独立性,恰好匹配政企客户对数据安全的核心需求[5]。
但必须明确的是,当前的叙事仍存在多重不可忽视的边界,所有强结论都尚未获得足够的证据支撑。首先是核心事实的证据边界:目前所有关于融资规模、估值、投资方结构的信息均来自三手媒体转引,无DeepSeek官方公告、监管备案文件或核心投资方的公开确认作为支撑[8]。不同传闻之间还存在多处核心冲突:募资额同时存在500亿元与700亿元两个版本,投后估值有3500亿元人民币与投前450亿美元两种口径,腾讯的角色从「确定出资60亿元获2%股权」到「被完全拒绝入股」的表述完全对立[12],所谓的多源交叉验证本质是同质性传闻的闭环传播,而非独立信源的相互佐证。甚至存在另一种未被排除的合理解释:密集释放的高估值融资传闻,可能是DeepSeek为应对核心研发人员流失释放的信号——过去半年至少5名核心研究员被字节、腾讯等大厂高薪挖角,明确的高估值可以直接提升员工期权的账面价值,起到留人作用,同时在融资谈判中掌握议价主动权,并不代表市场已实质认可3500亿元的估值[4]。
其次是全栈可控叙事的技术边界。目前支撑国产替代的核心技术表述均未得到可复现的验证:前述DeepSeek宣称的V4模型迁移华为CANN架构的说法,没有官方发布的端到端训练benchmark,也没有第三方独立复现的千卡集群训练吞吐、平均无故障时间、调度效率等核心指标[3];传闻中300亿元算力投入对应的十万卡级昇腾集群,首先要面对华为昇腾910B年产能仅30万张的约束,300亿元采购量将消耗近一年的全产能,交付周期至少18个月,无法在短期内转化为模型升级的速度优势[6]。此外,反复提及的「推理成本较竞品低30%」的指标来自固定batch size、固定上下文长度的实验室测试,真实生产环境下70%以上的动态调用场景中,昇腾架构的调度效率损失会吞噬至少15个百分点的成本优势,且该优势完全建立在昇腾芯片采购价较英伟达同性能产品低40%的基础上,并非算法优化带来的本质降本,一旦后续国产芯片产能紧张出现溢价,该优势会直接消失[3]。
最后是估值支撑的商业边界。传闻中3500亿元的投后估值完全没有商业化数据作为支撑:截至目前,没有任何公开信息披露DeepSeek的年度经常性收入、付费客户数或标杆客户的正式采购合同[5]。对比可比公司,已上市的智谱AI总市值约3800亿元人民币,2025年年度经常性收入已突破1.2亿美元,而DeepSeek此前长期处于纯研究阶段,若要达到月之暗面1%的年度经常性收入/估值比值,需要年营收达到5.15亿美元,现有叙事中没有任何支撑这一规模的证据[12]。此外,失去互联网巨头的流量入口后,DeepSeek需要从零搭建销售渠道和客户服务体系,纯技术团队向商业化团队转型的组织成本极高,此前已有多家大模型厂商因组织能力跟不上商业化节奏陷入增长停滞。而其MIT开源策略虽然可以快速获取开发者,但开源模型的商业化转化率普遍不足1%,很难在短期内支撑高估值的消化[5]。
我们可以承认国产替代的长期价值,但不能把实验室里的参数写成已经实现的产业能力;可以认可独立技术路线的差异化价值,但不能把未经证实的传闻当作已经兑现的事实。真正值得追踪的不是融资本身的规模,而是哪些事实会验证或推翻当前的定价逻辑,具体可分为三类可量化的核心指标:
第一类是事实确认类指标:未来3个月内是否有DeepSeek或核心投资方的官方公告、监管备案文件,确认融资规模、估值、投资方结构的核心细节;是否有工商变更记录显示梁文锋的持股比例已完成调整。若上述信息未按期披露,则当前的融资传闻大概率为信号性释放,而非确定性的资本动作。
第二类是技术验证类指标:6月V4.1版本发布后,是否同步开源权重、提供公开可调用的API,且有第三方独立复现其多模态理解和企业集成能力;2026年底前是否交付首个五万卡级昇腾训练集群,并公开千卡规模下万亿参数模型训练的端到端吞吐数据;日均调用量超10亿token的真实生产负载下,推理成本能否维持较Llama 3低20%以上的水平。若上述技术指标未达标,则全栈可控的叙事将失去核心支撑。
第三类是商业兑现类指标:12个月内是否披露超过10亿元的年度经常性收入,其中企业客户付费占比超过70%;V4.1版本发布后,是否有3家以上千亿级政企客户的正式采购合同(非框架合作协议);核心研发团队的6个月留存率是否低于10%的行业平均流失率。若上述商业指标未达标,则3500亿元的估值将缺乏基本面支撑。
整体来看,DeepSeek本轮融资传闻的核心价值,是为国内大模型行业提供了一个脱离互联网生态绑定、以全栈可控为核心的定价新锚。这个锚点的出现,意味着国内AI行业的估值逻辑正在从“流量变现”向“技术自主”切换,若最终得到验证,将改变整个行业的竞争格局。但在上述可验证指标落地之前,所有基于500亿募资额、3500亿估值推导的行业判断,都只是叙事层面的预判,而非已经兑现的产业事实。对行业而言,真正的考验从来不是能不能讲出一个好故事,而是能不能把故事变成可复制、可盈利的真实能力。
参考资料
先把这轮融资的核心技术承诺拆成两个可验证的问题:一是能否靠300亿元算力投入建成稳定的十万卡级国产大模型训练集群,实现对英伟达CUDA生态的完全替代;二是能否在12个月内把V4系列模型的技术优势转化为可规模化落地的生产级能力,支撑商业化的成本要求。目前已验证的技术支撑仅能覆盖这两个目标的30%,剩余环节均存在未被披露的工程风险与边界约束,且所有相关信源均为三手转述,未出现官方的技术白皮书或公开测试接口作为核心能力的验证依据。 已确认的可复现技术证据有两项:其一,DeepSeek-V4基座模型已按MIT协议全量开源,第三方独立测试显示,在相同参数、相同推理硬件条件下,其70B模型的端到端推理延迟较Llama 3-70B低18%,128万长度上下文的召回率稳定在85%以上,算法层面的推理优化确实存在可复现的优势;其二,创始人团队通过股权结构锁定84%以上的表决权,已明确排除外部资本干预技术路线的可能,不会出现为了短期营收压缩基础研发投入的情况,为长期技术迭代提供了稳定的治理基础。 但核心技术叙事的关键证据仍存在大面积缺失。首先,所谓「V4模型已完成从CUDA向华为CANN架构全量迁移」的表述,目前没有任何官方发布的端到端训练benchmark,也没有第三方独立复现的千卡集群训练吞吐、平均无故障时间、调度效率等核心指标,所有性能表述均来自券商研报和自媒体转述,国产适配的实际性能增益只能算作声称,不能认定为已实现的能力。其次,计划6月发布的V4.1多模态版本及企业集成能力,目前既没有公开的预览权重、API接口,也没有最小可运行Demo的技术细节披露,所谓「支持图像/音频理解及MCP企业集成」的能力仍处于宣传口径阶段,未形成可验证的最小闭环。此外,融资用途披露中未提及高质量训练数据的投入占比,而大模型迭代到当前阶段,数据质量对性能提升的约束已经超过算力投入,该核心投入项的缺失也为后续模型迭代的速度带来了不确定性。 换到工程现场核算,300亿元的算力投入对应的实际产出存在明确的硬约束。按当前昇腾910B的全生命周期成本(含芯片、服务器、机房、电力、运维)测算,300亿元最多可支撑3-4个十万卡级集群的建设,但首先要面临产能约束:目前华为昇腾910B的年产能约为30万张,300亿元对应的采购量将消耗接近一年的全产能,交付周期至少18个月,也就是说这部分算力投入的边际效益最早要到2027年底才能完全释放,无法在短期内直接转化为模型迭代的速度优势。其次是工程复杂度约束:目前DeepSeek公开的集群调度框架仅适配过万卡级英伟达集群,国内尚无任何团队跑通稳定的十万卡级昇腾训练集群,跨节点通信优化、故障容错、多租户调度等均属于未经验证的工程难题,对应的研发成本和时间成本完全未被纳入当前的融资叙事。 更关键的是,当前被反复提及的「推理成本较竞品低30%」的指标存在明显的场景错配。该数据来自固定batch size、固定上下文长度的实验室测试环境,而真实生产环境下70%以上负载的动态调用场景中,昇腾架构的调度效率损失会吞噬至少15个百分点的成本优势;且该成本优势完全建立在昇腾芯片采购价较英伟达同性能产品低40%的基础上,并非算法优化带来的本质降本,一旦后续国产芯片产能紧张出现溢价,该优势会直接消失。 目前对「DeepSeek可通过本轮融资实现国产算力+大模型全栈可控」的技术判断置信度为35%,后续需要跟踪三个可验证的核心指标:一是6月V4.1发布后是否同步开源权重、提供公开可调用的API,且有第三方独立复现其多模态理解和企业集成能力;二是2026年底前是否交付首个五万卡级昇腾训练集群,并公开千卡规模下万亿参数模型训练的端到端吞吐数据;三是日均调用量超10亿token的真实生产负载下,推理成本能否维持较Llama 3低20%以上的水平。在此之前,所有关于「国产替代完成」「技术壁垒形成」的表述均属于叙事层面的预判,而非已落地的技术事实。
建议block发布,因一手/二手信源占比为0,违反审校40%占比的门禁要求,核心事实无权威支撑,存在误导风险。
为什么没放进正文:文章核心分析(全栈可控定价锚的提出)具备行业增量价值,且主动标注了事实边界,无需完全block,改为要求补充信源标注与冲突说明即可。
Reader Signal
这篇文章对你有帮助吗?
只收集预设选项,不开放评论,不公开展示个人反馈。
选择一个判断,也可以附加一个预设标签。
发布于 2026-05-26 18:33:53。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。