DeepSeek首轮融资估值23天涨至450亿美元
DeepSeek首轮融资:450亿美元估值背后的定价转向与未决命题
所有涉及DeepSeek本轮融资的估值、融资金额及参与方信息均为市场传闻,无独立一手信源交叉验证。
2026年春夏之交,成立不到三年、始终坚持“不融资、不商业化、不路演”的DeepSeek,突然成为一级市场最受关注的标的。不到一个月的时间里,关于其估值的数字四次更新:从4月初传出融资意向时的100亿美元,到4月下旬互联网巨头接洽后的200亿美元,再到5月初国家集成电路产业投资基金入局后的450亿美元,最高甚至出现过含募资额的515亿美元投后估值预期[3][6][11]。创始人梁文锋计划个人出资200亿元占本轮融资总额的40%,成为最大出资方,同时拒绝了腾讯、阿里提出的大额入股请求,将外部股东持股比例严格限制在16%以内[5][12]。 这不是一次常规的科技公司融资事件。所有常规的估值逻辑——市销率、年化收入、用户变现效率——在这里都不适用,创始人自己当最大出资人的资本结构,也完全打破了一级市场“创业方找钱、投资方定价”的常规博弈。它更像一个明确的信号:国产大模型的定价逻辑,第一次脱离了“谁变现快谁值钱”的标尺,转向了对“底层基础设施卡位权”的争夺。需要说明的是,该定价逻辑仅适用于具备国产自主技术闭环能力的AI基础设施标的,并非全行业通用的估值标准。
被制造的“暴涨神话”:估值数字的口径迷雾
在讨论450亿美元估值的合理性之前,首先需要拆解这个数字本身的构成。目前广泛传播的“23天估值上涨近5倍”的叙事,本质上是将不同交易阶段、不同统计口径的数字放在同一时间序列下计算得出的结果,并不具备严格的统计意义[12]。 四个被广泛引用的估值节点,分属完全不同的交易状态:4月初的100亿美元是DeepSeek松口融资时的初始意向估值,彼时并无明确出资方报价;4月22日传出的200亿美元是腾讯、阿里接洽阶段的单边询价,并非双方达成的共识价格;5月初的450亿美元是国家大基金进入谈判阶段的意向估值,尚未签署任何有约束力的协议;最高的515亿美元则是包含500亿元全额募资额的预估投后估值,对应的投前估值仅约440亿美元[6][11]。将挂牌价、询价比价、谈判预估成交价混为一谈计算涨幅,本质上是用数字的精确感制造叙事冲击力。 更值得注意的是信源的同质性问题。目前涉及估值、融资金额、出资方的所有核心信息,均来自未披露身份的“知情人士透露”,13个公开信源中仅1个为一手信源,且仅提及“融资进入最后谈判阶段、创始人承诺坚持开源路线”,未涉及任何具体估值数字;剩余12个均为三手转引信息,DeepSeek、国家大基金、拟参投的互联网巨头均未发布任何正式公告或确认,甚至有信源明确提到“估值还未最终确认”[1][10][12]。看似100%的交叉验证率,实则是多个媒体对同一批信源的同源转抄,并非独立信源的交叉佐证。当前所有估值数据的本质是市场传闻,而非已经达成的交易结果。 当然,部分支撑估值逻辑的基础事实具备明确的可追溯性:QuestMobile公开数据显示,2025年2月DeepSeek日活跃用户突破3000万,是全球最快达成该用户规模的AI应用,曾登上140个国家的应用商店下载榜首位;MIT与Hugging Face联合发布的开源生态报告显示,DeepSeek的开源模型全球下载量占比达17.1%,位居国内首位;工商信息也确认,梁文锋通过直接与间接持股合计控制公司84.29%的股权,拥有绝对控制权[4][7][9]。但这些指标均无法直接推导估值水平——用户规模未对应商业化收入、开源影响力未转化为付费客户、控制权稳定不代表公允价值合理,三者与450亿美元估值的因果关联尚未得到验证。
脱离营收的定价逻辑:三个非市场化锚点
如果用传统的科技公司估值框架审视,450亿美元的意向估值几乎完全脱离了基本面支撑:DeepSeek从未公开过年度经常性收入(ARR)、付费转化率、毛利率等核心商业化指标,创始人还明确承诺“将资金优先用于AI研究,坚持开源开发路线,不急于短期商业化”[2]。对比之下,OpenAI超过8500亿美元的估值对应数百亿美元的年化收入,Anthropic9000亿美元的估值也建立在半年增长四倍的营收基础上,DeepSeek的估值逻辑显然另有支撑[11][12]。 拆解来看,450亿美元的意向定价建立在三个相互绑定的非市场化锚点之上,这也是国产大模型首次以“基础设施卡位权”为核心进行估值。 第一个锚点是绝对控制权的风险溢价。梁文锋在融资启动前通过增资将直接持股比例从1%提升至34%,加上通过关联实体的间接持股,合计控制84.29%的股权,本轮融资中外部股东的持股比例被严格限制在16%以内,且无法获得董事会的决策席位[7][11]。这种“创始人绝对主导、外部资本仅作为财务投资人”的结构,在一级市场的高估值科技公司中极为罕见。对于大模型这类长周期、高投入的赛道而言,控制权的价值在于彻底消除了资本倒逼短期变现、打乱研发节奏的风险——梁文锋个人出资200亿元成为最大出资人,相当于用真金白银和所有投资者绑定了共同风险,给出了“不会为了融资牺牲长期研发路线”的明确承诺[5][12]。 这种控制权设计还有一个明确的现实诉求:为员工期权定价。此前DeepSeek从未进行外部融资,员工持有的期权没有市场化的价格锚点,2025年11月至2026年4月间,有5名覆盖基座模型、代码、多模态等核心技术线的核心成员离职,其中多位是被竞争对手开出的“高薪+明确市价期权”挖走[8][12]。有市场观点认为,创始人通过大额自投拉高估值,本质上是用最小的股权稀释成本为员工期权确定市场化锚点——仅需少量外部资本的背书,就能将全员的纸面期权转化为有明确市价的资产,无需500亿元融资全额到位即可实现人才留存的核心目标[8][12]。 第二个锚点是战略资本的卡位诉求。估值跳涨的两个关键节点恰好对应两类资本的入局:4月22日估值从100亿美元跳升至200亿美元,对应腾讯、阿里的接洽;5月初估值升至450亿美元,对应国家大基金的进入[6][9]。两类资本的出价逻辑均不是基于当前营收,而是基于“不投就可能被排除在国产AI底层之外”的卡位焦虑。 对于互联网巨头而言,DeepSeek是目前国内少数未被其他巨头绑定、坚持开源路线、技术参数进入全球第一梯队的独立大模型标的。腾讯最初曾计划认购最多20%的股权,本质上是希望获得底层能力的优先接入权——如果DeepSeek最终成为国产AI的公共基础设施,不在股东名单中就只能作为付费用户采购,等于在下一代AI竞争中失去了底层控制权[11][12]。而国家大基金的入局则有更明确的战略意义:大基金三期此前的投资方向集中在芯片制造、设备、材料等硬科技领域,从未公开注资大语言模型厂商。DeepSeek已经完成V4系列模型在华为昇腾950PR芯片及CANN框架的全量迁移,两者的代码兼容性逼近95%,打破了国产大模型对英伟达CUDA生态的依赖[4][12]。这种“国产芯片-国产模型”的闭环能力,恰好契合战略安全的核心诉求,大基金的出价本质上是为国产AI技术底座的安全性背书,而非市场化的财务投资定价。 第三个锚点是可验证的技术底座能力。尽管高端模型的规模化能力尚未得到验证,但DeepSeek目前有两个技术优势具备跨场景的复现证据:其一就是推理成本控制能力,第三方开发者的测算显示,DeepSeek V2的推理成本仅为OpenAI o1的2%左右,其公开API定价也验证了这一成本优势,这也是它能快速获取C端用户和开发者的核心基础[4][12]。其二是开源生态的影响力,其开源模型的全球下载量占比、第三方开发者贡献数量均位居国内首位,开源路线意味着它可以更低成本地接入不同场景的应用,具备成为公共基础设施的可能性[4][7]。此外,V4系列在Agentic Coding、数学、STEM等公开基准评测中位居开源模型第一梯队,部分指标追平全球顶级闭源模型,也为其长期技术潜力提供了支撑[7][12]。
估值的边界:三个未决的核心风险
450亿美元的意向估值,本质上是市场对“DeepSeek将成为国产AI底层基础设施”的提前定价,但这个定价的成立前提,是一系列尚未验证的假设。目前来看,至少有三个核心风险可能直接击穿当前的估值逻辑。 第一个风险是技术优势的脆弱性。DeepSeek当前的成本优势是绑定国产算力栈的专属优化结果,而非通用算力栈的普适性突破,也就是说推理成本的下降高度依赖昇腾950PR的产能释放与CANN框架的持续迭代,这一供应链依赖属于外部不可控变量[1][12]。官方明确标注,目前V4-Pro的服务吞吐受限于高端算力,预计2026年下半年昇腾950超节点批量上市后才能实现规模化交付,也就是说其宣称的最高性能版本目前仍未进入生产可用阶段,无法形成稳定的技术交付能力[4][12]。 此外,V4系列的高端性能仍存在多处未经验证的空白:其百万token上下文能力仅披露了容量提升,未公开长上下文场景下的信息召回率、端到端延迟、准确率衰减曲线等企业级落地的核心指标;开发者试用反馈显示,V4相对V3的单位推理成本上涨40%,性能提升带来的成本增量尚未被规模效应摊薄;而核心岗位人才流失的影响也尚未显现,尽管其整体研发团队离职率仅为3.3%,但覆盖核心技术线的5名核心成员离职,是否会影响后续的模型迭代节奏,还需要V4.1等后续版本的发布进度验证[1][8][12]。 第二个风险是商业化与退出逻辑的矛盾。当前的估值完全建立在战略卡位和技术预期之上,没有任何商业化数据支撑:3000万日活均为C端免费用户,无公开付费转化率;企业端API和Agent服务尚未放量,V4-Pro的产能限制也使其无法承接大规模的企业订单[6][9]。创始人“不急于短期商业化”的承诺,更与资本的退出需求形成了直接冲突:450亿美元的估值规模下,股权回购成本过高,老股转让无法满足大额资本的退出需求,IPO是唯一可行的退出路径,但IPO的核心前提恰恰是商业化能力得到验证[3][6]。如果2026年底DeepSeek仍无法拿出具备说服力的ARR数据,下一轮融资的估值锚点就会出现坍塌风险——战略卡位的溢价总有上限,无法永远脱离现金流支撑估值。 第三个风险是多方资本的诉求冲突。目前入局的三类资本诉求存在本质差异:国家大基金优先要求国产自主可控,产业资本优先要求生态接入和商业协同,创始人则坚持开源AGI的长期路线[11][12]。尽管当前创始人的绝对控制权可以暂时压制诉求冲突,但随着资金的逐步到位,资本的附加诉求会逐步显现:比如大基金可能要求优先服务政务、国企等核心场景,腾讯可能要求将DeepSeek能力优先接入微信生态,这些诉求都可能挤压开源社区的研发资源,甚至改变原定的技术路线。而梁文锋自投200亿元的资金来源也尚未披露——按照公开估算,2025年其从幻方量化获得的管理费与业绩提成约为7亿美元,折合人民币不足50亿元,剩余的出资来源如果涉及外部杠杆,也可能成为影响控制权稳定性的潜在变量[4][12]。
可验证的观察指标:四个判断校准锚
对于这一尚未落定的融资事件,真正值得关注的不是估值数字的高低,而是后续可量化的落地指标,只有这些指标才能验证当前的估值逻辑是否成立。 第一个指标是2026年下半年昇腾950超节点量产后的V4-Pro交付数据,包括API定价的下降幅度、并发吞吐能力、第三方机构在生产级负载(十万级token长文档并发处理、多Agent协同任务、工业级代码生成)下的性能复现结果,这将直接验证其高端模型的规模化交付能力和成本优势的可持续性[1][4]。 第二个指标是2026年第三、第四季度的商业化数据,包括企业端API和Agent服务的ARR规模、付费客户数量、毛利率,以及3000万C端日活的付费转化率。这是判断当前估值是否脱离基本面的核心锚点——如果年底仍无明确的商业化路径,估值的支撑逻辑就会从“基础设施卡位”转向“纯资本博弈”[6][11]。 第三个指标是核心研发团队的留存率和模型迭代节奏,包括未来6个月核心技术岗位的离职率、V4.1及后续版本的发布是否能保持2-3个月一个大版本的迭代频率,这将直接验证期权定价的人才留存效果和核心技术团队的稳定性[8][12]。 第四个指标是控制权的稳定性,包括融资完成后外部股东的持股比例是否突破16%、是否有外部股东进入董事会参与决策、是否出现与开源路线冲突的业务调整,这将验证“创始人绝对主导研发路线”的承诺是否成立[7][11]。 从“百模大战”时拼参数、拼融资额,到现在拼底层能力、拼自主权、拼战略卡位,DeepSeek的这轮融资确实标志着国产大模型行业进入了新的阶段。450亿美元的意向估值,一半是对国产AI自主路线的赌注,一半是资本卡位的博弈结果,它既不是已经兑现的行业神话,也不是毫无依据的资本泡沫。最终能支撑这个估值的,永远是可验证的产品能力和商业化结果,而非叙事或背书。所有的答案,都会在未来6个月的落地数据中逐步显现。
所有内容基于可追溯公开信息生成,所有估值、融资细节均为市场传闻,尚未得到交易各方的正式确认,后续将根据官方披露信息持续更新判断。
参考资料
先把DeepSeek23天估值涨至450亿美元的叙事拆成可验证的工程问题,当前其技术层面的核心支撑来自两个可部分验证的事实:一是V2到V4系列模型的推理成本控制能力,二是国产算力栈的适配进度,但现有公开技术证据不足以完全支撑该估值对应的长期技术壁垒预期,且存在多个关键的工程可验证缺口。 Hugging Face公开数据显示其开源模型全球下载量占比达17.1%,居国内首位,V2的推理成本经第三方开发者测算仅为OpenAI o1的2%左右,对应公开API定价也验证了这一成本优势,这一指标是当前其技术叙事中唯一有跨场景复现证据的核心优势。V4系列公开的Agentic Coding、数学与STEM评测结果,确实达到开源模型第一梯队,部分指标追平顶级闭源模型,且有开发者试用反馈其在华为昇腾950芯片上的推理速度较初期版本提升35倍,CANN与CUDA的代码兼容性逼近95%,这一适配进度打破了国产大模型依赖英伟达算力的常规路径,是其差异化的技术布局。 问题在于,支撑高端能力的核心技术细节仍存在多处未经验证的空白。首先,V4-Pro比肩顶级闭源模型的主张仅来自公开基准榜单数据,尚无第三方机构在企业级真实生产负载(如十万级token长文档并发处理、多Agent协同任务、工业级代码生成)下的复现报告,且官方明确标注当前Pro版本的服务吞吐受限于高端算力,预计下半年昇腾950超节点批量上市后才能放量,也就是说其宣称的最高性能版本目前仍未进入规模化生产可用阶段,无法形成稳定的技术交付能力。其次,V4系列百万token上下文的核心参数仅披露了容量提升,未公开长上下文场景下的信息召回率、端到端延迟、准确率衰减曲线等生产落地核心指标,而这些指标直接决定了其高端模型的商用价值,目前仅能从少量开发者试用反馈中得知V4相对V3的单位推理成本上涨40%,性能提升带来的成本增量尚未被规模效应摊薄。此外,公开信息显示2025年11月至2026年4月期间,有5名覆盖基座模型、代码、多模态等核心技术线的核心开发者离职,尽管有统计称其整体研发团队离职率仅3.3%,但核心岗位流失对后续模型迭代节奏的影响尚未有可量化的技术产出数据支撑,比如V4.1版本的迭代进度能否保持此前的技术领先性,目前仅存在发布计划,无明确的可验证里程碑。同时,目前披露的融资规模、出资结构与估值均为市场传闻,无正式的出资协议或工商变更披露,后续资金能否足额到位并投入算力与研发,也是影响技术迭代的关键变量。 更关键的是,当前的技术优势存在明确的边界约束。其一,其成本优势是绑定国产算力栈的专属优化结果,而非通用算力栈的普适性突破,也就是说推理成本的下降高度依赖昇腾950的产能释放与CANN框架的持续迭代,这一供应链依赖属于外部不可控变量,直接决定了其高端模型的成本下调进度与规模化能力,目前无法通过自身技术迭代完全消除风险。其二,创始人承诺的开源AGI路线与融资后的规模化商业需求存在工程层面的隐性冲突:开源模型的迭代需要公开权重、训练细节与社区协作,而企业级商业化落地需要闭源的定制化优化、数据隔离与专属服务,两条路径的研发资源分配、架构兼容与维护成本目前尚未有公开的工程方案支撑,能否同时保持开源社区的影响力与商业化的交付效率,仍需后续验证。 真正需要观察的不是估值涨幅或融资规模,而是四个可量化的技术指标:一是2026年下半年昇腾950超节点量产后,V4-Pro的API定价下降幅度与并发吞吐数据是否达到官方宣称的目标;二是V4.1版本发布后,第三方机构在生产级负载下的长上下文召回率、推理延迟与成本数据;三是未来6个月核心研发团队的留存率,以及模型迭代频率能否保持每2-3个月一个大版本的节奏;四是开源社区的第三方贡献者数量与产业适配项目的增长速度,能否支撑其宣称的全球开发者影响力。当前技术支撑的整体置信度约为65%,其中成本控制与国产适配部分的置信度为80%,高端模型规模化能力与长期迭代稳定性的置信度仅为30%,所有判断均需以上述可验证指标的落地情况为准。
建议将主标题调整为「DeepSeek23天估值涨5倍!450亿背后的资本狂欢」,强化流量属性
为什么没放进正文:需坚守差评批判编辑定位,避免流量化叙事稀释核心逻辑(估值逻辑转向)的深度,不符合品牌调性
Reader Signal
这篇文章对你有帮助吗?
只收集预设选项,不开放评论,不公开展示个人反馈。
选择一个判断,也可以附加一个预设标签。
发布于 2026-05-23 07:28:27。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。