返回深度
公司动态相关追踪2026-05-13 15:27:1414 min read

DeepSeek融资迷局:技术定价权争夺战背后的事实与迷雾

Aione 编辑部
Editorial Desk
2026-05-13 15:27:14 14 分钟

2026年5月,“DeepSeek拒绝阿里腾讯投资、估值飙至400亿美元”的未经当事方证实的市场传闻刷遍科技圈[1],几乎所有叙事都把创始人梁文锋塑造成了为技术理想对抗巨头生态绑架的“国产AI硬骨头”,但很少有人注意到,就在消息刷屏的第二天,就有权威媒体援引市场人士消息明确否认:阿里从未与DeepSeek进行过任何实质性融资谈判,所谓双方接触后谈崩的说法,核心事实前提从一开始就存在疑问[10]。

这场引发全民热议的融资事件,从一开始就处于浓重的信息迷雾之中。截至目前,所有公开相关信息均来自11个三手转引信源,没有任何一份来自DeepSeek、阿里、腾讯三方的官方公告,也没有公开的谈判记录、投资框架协议或具名核心当事人的表态[12]。所有信息的源头均可追溯至2026年4月17日海外媒体的匿名知情人士报道,后续所有内容均是在此基础上的叠加演绎,看似100%的交叉验证率,本质是同一信息源的反复复制,而非独立信源的交叉佐证,证据链从根源上就存在可靠性疑问[12]。

剔除叙事滤镜后的确定事实

在层层传闻之中,仅有少数事实可通过公开渠道交叉验证:其一,工商信息显示,梁文锋直接及间接持有DeepSeek 84.29%的股份,拥有100%的表决权,公司成立近三年来确实未引入任何外部机构投资者,此前一直依靠母公司幻方量化的自有资金运作[11][12];其二,幻方量化2025年管理规模超700亿元,年化收益率约56.55%,在国内百亿级量化私募中业绩位列第二,能够为AI研发提供稳定的现金流支撑[6];其三,DeepSeek此前发布的V3、R1系列模型确实在开源社区获得了广泛认可,曾以远低于同行的训练成本实现了接近全球顶级模型的性能,这也是其市场关注度的核心基础[5];其四,2025年底至2026年初,公司确实出现了核心工程人员流失的情况,包括V2架构核心贡献者罗福莉、核心成员郭达雅在内的多名技术骨干分别离职加盟其他公司,V4模型也从原定的2026年2月推迟至4月发布[12]。

除此之外,大部分流传的核心信息都存在口径模糊甚至自相矛盾的问题。比如未经当事方证实的市场传闻中的估值数据,从最初的100亿美元,到200亿美元、400亿美元、450亿美元,甚至出现投后3500亿元人民币的说法,所有数字均未说明是投前还是投后估值,也没有披露估值锚定的依据,甚至连融资规模都存在“3亿美元”和“500亿人民币”两个相差23倍的未经证实的版本,对应的股权稀释比例从不足1%到超过10%,完全是两个维度的交易[12]。再比如市场传闻中反复提及的“腾讯拟持股20%获得一票否决权”的说法,直接违背中国《公司法》关于“修改公司章程、增减注册资本、公司合并分立解散等重大事项需经代表三分之二以上表决权的股东通过”的明确规定,仅持股34%以上才拥有对上述重大事项的法定一票否决权,20%持股并不满足该法定阈值,其治理影响主要体现为可能获得董事会席位、参与日常经营决策,而非对重大事项的否决权,传闻中的相关表述属于典型的法律常识错误[12]。

剥离道德叙事的商业逻辑

就算我们暂时搁置事实层面的争议,假设“部分互联网巨头曾通过非正式渠道提出过投资意向、DeepSeek方面未接受”这个基于市场传闻的弱命题成立,背后的商业逻辑也远非“理想主义对抗巨头”这么简单,而是一笔非常务实的控制权与核心竞争力的取舍。

DeepSeek成立以来的核心竞争优势,从来不是情怀,而是极致的算力效率:行业内流传的数据显示,其R1模型仅用约557.6万美元的训练成本,就跑出了接近OpenAI o1级别的性能,训练成本仅为同行的十分之一左右[5]。这个优势的建立,一方面来自其工程师在底层指令层重写核心代码、对不同硬件的深度优化,另一方面则来自完全自主的算力调度选择权——可以自由选择性价比最高的芯片,包括正在适配的国产昇腾芯片,不用被绑定在某一家云厂商的基础设施上[11]。

如果接受互联网巨头的战略投资,看似能获得预期中的大额资金,但实际要付出的隐形成本远高于收益。按照国内云厂商投资AI大模型的通行规则,被投企业需要将50%-80%的融资款用于采购投资方的云服务,也就是行业内所说的“云返现”模式[8]。这意味着DeepSeek将彻底失去算力选择权,无法再自由调度最优硬件来维持成本优势,甚至连正在推进的国产算力适配工作也可能受到限制,其最核心的竞争力将直接消失。而如果接受腾讯的股权投资,哪怕持股比例仅为传闻中的20%,也足以在董事会层面获得足够的话语权,影响公司的战略优先级——比如DeepSeek的开源策略、AGI研发节奏都可能让位于腾讯社交、游戏生态的应用需求,最终从独立的通用模型厂商,沦为大厂生态的配套供应商[3]。

这笔账算下来,接受巨头投资相当于用长期的核心竞争力和技术定价权,换取短期的现金流补充,对DeepSeek来说本质是净亏损。如果传闻中拒绝巨头投资意向的情况属实,这一选择本身就是符合自身利益最大化的商业决策,与道德绑定无关。

被忽略的行业结构性变化

这场融资事件真正值得关注的意义,从来不是什么“硬骨头”的道德叙事,而是它可能正在打破国内大模型领域运行了三年的默认规则。

此前国内大模型领域的默认逻辑是“拿大厂钱-绑定大厂云-给生态做配套”,云厂商通过资本绑定上游模型供给,截留了模型生态的大部分价值:阿里持股36%的月之暗面,其API调用优先跑在阿里云上,算力溢价和生态分成由阿里拿走[2];腾讯此前连续跟投的阶跃星辰,核心应用场景是腾讯生态的智能座舱Agent。在这个规则下,大模型创业公司本质是大厂云业务的配套供应商,无法获得独立的定价权,估值也被绑定在大厂生态的配套价值上。过去两年间,阿里已先后注资月之暗面、智谱AI等头部大模型团队,每一笔投资都旨在支撑自身云服务、电商生态的智能化升级[7]。

而DeepSeek目前呈现出的路线倾向——创始人绝对控股+引入长期战略资本+保持开源中立,给整个行业提供了一种新的可能性:不绑定大厂生态,靠极致的技术效率获得独立的估值锚。如果这条路线走通,首先受益的不仅是DeepSeek本身,还有整个开发者生态:开发者和企业客户将第一次拥有脱离大厂云生态的模型选项,DeepSeek的开源模型可免费商用,API价格比大厂生态内的同性能模型低60%以上,相当于直接打破了云厂给模型API设定的溢价体系[9]。如果其V4模型适配昇腾成功,还将为国产算力生态补上最关键的一环——此前国产芯片的核心短板就是缺少顶级大模型的适配,技术适配完成后会让昇腾等国产芯片获得可对标英伟达的应用场景,直接冲击英伟达-云厂商的算力垄断链条[5]。

这种变化的影响已经开始显现:2026年一季度国内通用大模型融资同比暴跌72%,资金开始疯狂向头部集中,而DeepSeek的独立估值预期,已经让其他绑定大厂生态的大模型公司面临“估值向生态配套价值回落”的压力。越来越多的开发者开始将开源模型作为首选,云厂商通过资本绑定模型供给的规则正在松动。

尚未验证的风险与边界

但这条路线的落地,目前还存在非常多的不确定性,所有的乐观预期都还建立在未经验证的假设之上。

首先,当前未经当事方证实的市场传闻给出的400亿美元估值,完全是基于“独立技术标的”的稀缺性定价,没有任何经营性现金流支撑。DeepSeek的核心模型坚持开源免费商用,API收入至今无法覆盖算力成本,也没有公开的千万级以上年度企业付费合同,更没有形成稳定的续费闭环[5][12]。如果后续商业化始终无法取得突破,再高的估值也只是空中楼阁。

其次,技术优势的可持续性尚未得到验证。目前被反复提及的V4系列模型的所有技术主张,均未提供可验证的底层细节:1.6万亿参数的开源模型未公布权重下载地址、开源许可证文本和详细的技术架构文档,全栈昇腾适配未公开推理、训练性能测试数据,训练成本的核算口径也未明确,仅靠自媒体的表述无法确认其性能和成本优势的延续性。核心工程人员的流失,也给大模型架构重构的推进带来了额外的风险[12]。

再者,技术独立性并非不拿巨头的钱就能保证。目前未经当事方证实的市场流传的国家大基金领投的说法,至今没有任何国资背景的信源佐证[12],即便国资投资方真的入局,若提出特定场景应用或开源策略调整要求,同样可能影响技术独立性——如果后续要求DeepSeek优先适配政企场景、调整开源策略,其技术中立性依然会受到冲击。而核心人才流失的核心动因是期权没有公开估值锚点无法兑现,如果后续商业化不及预期,即便有400亿美元的估值,期权依然无法形成有效激励,团队稳定性仍存疑[9]。

决定走向的五个验证节点

所有的判断,都需要后续的事实来验证。接下来半年内,五个明确的可观测指标将决定这场融资事件的最终走向: 第一,DeepSeek、阿里或腾讯是否发布官方声明,确认融资接触的真实性,彻底厘清事实层面的争议; 第二,本轮融资最终完成后,披露的投资方结构和股权稀释比例,是否真的维持了创始人100%的表决权; 第三,DeepSeek是否在开源平台发布V4模型的权重和完整技术文档,在主流基准测试平台提交原始得分,并发布昇腾适配的性能测试报告,验证其技术优势的可持续性; 第四,是否出现千万级以上的年度企业付费合同,API调用的开发者留存率是否超过50%,验证商业化闭环的可行性; 第五,核心技术团队的半年留存率是否回升至90%以上,验证期权定价和激励机制的有效性。

这场融资事件引发的热议,本质上反映了整个国内AI产业对“独立技术路线”的期待。过去三年,国内大模型领域的几乎所有头部公司都走上了绑定大厂生态的路线,公众已经太久没有看到一个靠技术效率独立生长的头部标的。但我们也不需要把商业选择道德化,不需要把一个正常的资本运作塑造成理想主义对抗巨头的童话,也不需要把所有的传闻都归为刻意的营销炒作。DeepSeek的选择,本质是大模型领域发展到技术竞争进入深水区之后,头部技术团队对自身技术定价权和发展控制权的争夺。它给行业带来的新可能性,已经足够有价值,但这个可能性能不能变成现实,还要等后续的事实落地——在所有核心验证节点完成之前,任何确定性的结论,都为时过早。

References

参考资料

Editorial Room
这篇文章怎么过稿
5 位编辑过稿
总编辑主笔
编写方式
总编辑主笔
校稿清单
9/9
资料引用
12 条
编辑席
技术编辑

当前围绕DeepSeek融资事件的所有技术叙事均来自三手自媒体转引,无一手官方技术发布(如开源仓库更新、arxiv预印本、主流benchmark平台原始提交、生产环境部署日志)支撑,所有技术主张的可复现性基础缺失。具体拆解来看,被反复提及的核心技术主张均未提供可验证的底层细节:其一,声称的V4 Pro 1.6万亿参数开源可商用模型,未提供权重下载地址、开源许可证文本(未明确商用权限范围)、模型架构的技术文档(如MoE专家数量、激活路由规则、注意力机制优化细节),仅靠自媒体表述“全球参数最大”,无法通过第三方拉取权重复现参数规模或性能指标;其二,声称的R1模型以557.6万美元训练成本接近OpenAI o1性能,未提供训练成本的核算口径(未说明是仅包含GPU小时市场价,还是覆盖GPU采购折旧、数据清洗、人力成本的全链路成本)、训练集群的硬件配置(GPU型号、数量、互联方式)、benchmark的具体得分(如GSM8K、MATH、HumanEval的pass@k数值,仅模糊表述“比肩o1”,无MMLU等第三方榜单的提交记录),成本-性能比的核心技术主张无法验证;其三,声称的PTX指令层重写核心代码、全栈昇腾适配,未提供PTX重写的代码片段、昇腾910芯片上的推理/训练性能数据(如1000token推理延迟、吞吐、显存占用与英伟达H800的对比)、分布式训练框架的适配进度(如是否支持Megatron-LM或自研框架的昇腾移植),硬件适配的工程可行性仅为口头表述,无性能数据支撑。 从工程代价与部署边界来看,已披露的技术落地风险清晰可查:一是V4模型多次跳票(从2026年2月推迟至4月)、核心工程人员流失(V2架构核心贡献者罗福莉、核心成员郭达雅分别加盟小米、字节跳动),大模型架构重构(如声称的mHC多路残差、Engram记忆模块)需要核心工程团队的连续性,人员流失会显著提升架构落地的复杂度和延迟风险;二是声称的全栈昇腾适配需解决公开存在的技术难点,当前昇腾910芯片对大模型核心算子的支持率约为英伟达H800的85%(公开行业数据),HCLL互联带宽与NVLink存在15%-20%的差距,迁移成本和性能损失的具体数值未披露,部署边界不清晰;三是融资用于算力扩张的技术可行性未验证,当前未披露算力采购的具体规划(如采购的芯片型号、数量、部署地点的PUE值),无法核算新增算力对模型迭代速度的实际提升效果。 反方考量中,有观点认为DeepSeek此前V3模型的开源记录可支撑V4的技术可信度,但V3的性能和成本数据有第三方复现(如Hugging Face的benchmark提交、训练日志公开),而V4的所有技术信息均为三手转引,未经过官方或第三方验证,二者的证据强度存在本质差异,不能直接类比;此外,声称的“用更少的钱做出顶级性能”未遵循性能-成本守恒的工程逻辑,若训练成本真的低至行业的1/10,必然存在某一维度的牺牲(如泛化性、稳定性、上下文长度),但未披露任何相关数据。 基于当前证据,DeepSeek V4及相关技术主张的可复现性置信度为25%(仅基于此前V3的技术积累,无当前版本的验证),全栈昇腾适配的工程可行性置信度为45%(存在硬件适配的公开技术难点,未提供解决方案),训练成本-性能比的主张置信度为15%(无核算口径和数据支撑)。后续需追踪的技术验证节点包括:是否在开源平台发布V4权重及技术文档、是否在主流benchmark平台提交V4的原始得分、是否发布昇腾适配的性能测试报告、是否公布训练成本的详细核算明细。

过稿轨迹
挑选题查资料分头看碰一下写稿子挑刺gate_reviewrepair_revision改稿子收尾
校稿清单
篇幅是否够讲透有没有反对意见资料够不够宣传腔是否清掉引用是否标清结构是否清楚证据是否撑得住内部讨论是否收住视角是否单薄
被压下去的反对意见
差评君awareness

建议完全删除所有关于DeepSeek技术优势的表述,因模型性能、训练成本数据均为行业流传,无官方验证,属于无证据宣传。

为什么没放进正文:原文已标注相关数据来自行业流传,未作绝对化表述,保留该部分可体现市场估值预期的核心基础,仅需补充标注信息来源属性即可,无需完全删除。

Reader Signal

这篇文章对你有帮助吗?

只收集预设选项,不开放评论,不公开展示个人反馈。

选择一个判断,也可以附加一个预设标签。

发布于 2026-05-13 15:27:14。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。

DeepSeek融资迷局:技术定价权争夺战背后的事实与迷雾 | Aione