返回深度
公司动态相关追踪2026-05-25 18:20:5517 min read

估值传闻与降价信号背后:大模型行业的定价暗战

Aione 编辑部
Editorial Desk
2026-05-25 18:20:55 17 分钟

2026年5月的全球大模型行业,被两组看似无关的信号推到了舆论中心。一组核心原始信源为彭博、《华尔街日报》5月23日援引知情人士的独家报道:美国初创公司Anthropic即将完成超300亿美元融资、估值突破9000亿美元,若传闻落地,其估值将超越OpenAI成为全球最高的AI初创企业[2][11];另一组是国内大模型厂商DeepSeek官方发布的确定性公告:V4-Pro API永久降价至原定价的四分之一,同步披露其API调用量居全球首位[1][5]。两组信号快速被整合为“海外头部厂商资本化加速、国内厂商以价换量抢占市场”的行业叙事,但很少有讨论触及两组信号背后的信源质量、统计口径以及未被言明的定价逻辑。

值得首先明确的是,当前所有关于Anthropic本轮融资、估值、营收的公开信息,均来自国内媒体对彭博、《华尔街日报》同一组知情人士报道的转引,Anthropic、领投机构Dragoneer Investment Group、绿橡资本均未发布官方声明,交易也尚未完成交割,多渠道的信息扩散本质是同源信息的传播,并非独立信源的交叉验证,因此相关内容仅能作为一级市场情绪的参考,无法作为确定性的行业结论[2][11]。而DeepSeek的降价动作虽为官方发布的一手信息,但配套的运营数据同样缺乏SimilarWeb、Artificial Analysis等第三方监测机构的独立验证,核心指标的统计口径也存在模糊空间。

估值传闻的口径迷雾与逻辑矛盾

拆解Anthropic的估值传闻,首先需要厘清几组容易被混淆的统计口径。彭博、《华尔街日报》原始报道中提及的9000亿美元估值,在后续转引中既有标注为投前估值,也有标注为投后估值的表述,二者的差值恰好等于本轮300亿美元的融资额——若9000亿为投前估值,则投后估值将达到9300亿美元;若为投后估值,则投前估值为8700亿美元。而OpenAI当前8520亿美元的估值,是2026年3月完成融资交割的实际投后估值,二者并非同一时间节点的可比数据,直接对比得出“Anthropic估值反超OpenAI”的结论,存在统计基准错位的问题[11][12]。

另一组被广泛传播的“营收一年增长十倍”的表述,同样需要明确口径。传闻称Anthropic 2025年7月的年化营收运营率仅为40亿美元,2026年Q2预计单季度营收达到109亿美元,对应年化营收运营率突破500亿美元,不足一年增长十余倍。这里的“年化营收运营率”是根据当期单月或单季度营收推算的全年预期值,并非实际完成的年度营收,两组数据属于同一口径的推算值对比,但所有数据均未经过官方审计或公开财报验证,其真实性仍有待确认[7][9]。

更值得关注的是传闻中存在的逻辑矛盾。据原始报道披露,Anthropic与SpaceX签署了至2029年总价近450亿美元的算力采购协议,覆盖22万GPU,此外还与Akamai签署了18亿美元的算力协议,同时从谷歌采购芯片和云服务[8][12]。需要说明的是,以下测算为基于公开算力合同的假设性推断:仅SpaceX的算力合同年平均支出就超过90亿美元,叠加人员薪酬、运维、渠道分成等成本,若Q2单季度营收为109亿美元,要实现首次盈利的难度较大。目前没有公开信息解释这一矛盾,也没有数据披露Anthropic与云厂商、渠道方的分成比例——若分成比例超过30%,其模型业务的实际毛利将远低于市场预期。

从过去三个月的一级市场估值变动来看,Anthropic的估值预期已经出现了较大波动:2026年2月其完成G轮融资时估值为3800亿美元,4月一级半市场的非公开交易隐含估值一度接近1万亿美元,本次传闻的9000亿美元估值较一个月前的峰值已经有所回落[7][12]。如此剧烈的估值波动并未伴随公开的业绩或战略调整公告,这也说明当前的估值溢价部分来自一级市场的资金供需,而非基本面的确定性变化——OpenAI进入上市前缄默期后,此前计划投向通用大模型赛道的增量美元资金缺乏可投标的,只能转向同层级的Anthropic,这种头部资产的供给缺口,是推高其估值预期的重要非基本面因素[11]。

此外,传闻中提及的核心技术优势同样尚未得到验证。Anthropic近期引入了OpenAI联合创始人、前特斯拉AI负责人Andrej Karpathy牵头预训练团队,计划用Claude大模型优化预训练流程,这一技术路线被部分解读为支撑其高估值的核心技术壁垒[7][8]。但截至目前,该路线仍处于早期研究阶段,没有公开的实验数据或架构细节证明其能带来可规模化的训练效率提升,无法支撑估值对应的技术代差预期。

降价动作的成本边界与动机模糊

与Anthropic的估值传闻不同,DeepSeek V4-Pro API永久降价是厂商官方发布的确定性动作,但核心指标的模糊性同样需要厘清。首先,“降至原定价的四分之一”中的“原定价”,指的是DeepSeek公开挂牌的非折扣官方指导价,而此前DeepSeek针对不同层级的大客户存在最高达70%的阶梯折扣,因此对于原有大客户而言,本次降价后的实际成交价降幅远低于75%[8][4]。按降价后的公开挂牌价计算,V4-Pro的输入成本为每百万token 0.1美元,仅为同能力级别GPT-4o API价格的约3%,价格优势极为显著。

另一组被广泛传播的“调用量居全球首位”的表述,目前仅来自DeepSeek官方披露,尚无SimilarWeb、Artificial Analysis等第三方监测机构的独立数据支撑,且未明确统计口径是调用次数、有效token量还是付费调用量,统计窗口也未公开,因此暂不具备统计可比性[1][4]。第三方机构Artificial Analysis的标准评测成本对比显示,国内另一家大模型厂商智谱的API单位成本为544美元,低于DeepSeek的1071美元,这也意味着DeepSeek的降价并未触及当前国内大模型API市场的成本底线[8]。

从技术逻辑来看,DeepSeek的降价确实有其架构基础:V4-Pro采用总参数1.6万亿、单次推理仅激活490亿参数的MoE(混合专家)架构,稀疏计算的特性使得其同等推理效果下的激活参数量仅为同能力稠密模型的1/3到1/4,理论上单位token的推理成本可同步下降,叠加缓存优化削减90%的缓存命中成本,确实有能力支撑大幅降价[8]。但MoE架构的成本优势存在边界:稀疏计算的路由调度、负载均衡、故障容错的运维复杂度远高于稠密模型,目前DeepSeek尚未公开高并发场景下的SLA(服务水平协议)承诺,若调用量真的达到官方披露的规模,峰值负载下的算力调度成本、稳定性风险都会同步上升,当前定价能否覆盖全场景成本仍有待验证。

市场同时有传闻称DeepSeek正在推进总额700亿元人民币的新一轮融资,宁德时代等产业资本计划参与,这也意味着本次降价除了抢占市场份额的商业考虑外,也有可能是为了在融资前拉升用户规模和调用量数据,而非完全基于推理成本的实质性下降[4]。此外,目前尚未出现大规模百万年预算级别的企业客户从OpenAI、Anthropic迁移到DeepSeek的案例,其当前调用量的核心贡献者仍以长尾开发者、中小智能体厂商以及对价格敏感的创业公司为主,这类客户的迁移成本极低,很难形成稳定的长期预算流向。

正在固化的双场域定价逻辑

两组看似无关的信号,实际上折射出通用大模型市场正在加速分化为两个边界清晰的定价场域,这一分化趋势已经在多家头部厂商的动作中得到验证,并非仅由两个个案支撑。除Anthropic和DeepSeek外,至少三家头部厂商的策略调整均指向这一分化:一是OpenAI,其近期完成内部重组,将ChatGPT、Codex、API三条产品线合并,关停Sora项目全力冲刺IPO,同时重点拓展年付费超百万美元的企业级客户,推出专属算力集群、数据隔离等定制化服务,并未跟进通用API的降价[8];二是谷歌,其一方面针对金融、医疗等合规要求高的行业推出Gemini Enterprise专属服务,提供数据不出域、审计留痕等企业级能力,定价较通用API高出3倍以上,另一方面推出Gemini 3.1 Pro高速版,API输出速度达到400 tokens/s,同时将Gemini Ultra的订阅价降至100美元/月,将配额从次数制改为算力制,同时覆盖两个场域的需求[8];三是国内大模型厂商智谱,其针对政府、央企客户推出私有化部署、专属算力集群的定制化服务,单项目合同金额可达千万元级别,同时面向开发者市场推出的GLM系列API单位评测成本仅为544美元,低于DeepSeek的1071美元和OpenAI的3357美元,以极致性价比争夺长尾用户[8]。

第一个场域是由一级市场资本、云厂商战略资金和头部企业客户支撑的“高确定性付费场域”,核心定价逻辑是算力供给的排他性、服务的合规性和长期合作的稳定性,客户对价格的敏感度较低,对服务可用性、数据安全、长上下文能力的要求极高。Anthropic的估值传闻正是这个场域定价逻辑的典型体现:据公开披露信息,其超过65%的客户为金融、法律、代码开发等领域的企业级用户,本轮融资的绝大多数资金将用于锁定未来5年的算力供给,本质是用股权置换供给确定性,从而绑定长期企业客户[7][12]。高确定性场域的核心竞争壁垒是算力锁仓能力、企业级销售渠道和合规能力,主要玩家是Anthropic、OpenAI、谷歌等拥有充足资本和云厂商资源的头部厂商。

第二个场域是由长尾开发者、中小创业公司和测试需求构成的“成本敏感型场域”,核心定价逻辑是单位token的性价比和调用的便捷性,客户对价格的敏感度极高,对合规性、服务SLA的要求相对较低。DeepSeek的降价正是精准切入了这个场域的空白——此前市场上的旗舰模型价格过高,而开源模型的能力又无法满足部分开发者的需求,DeepSeek的定价恰好填补了“性能够用、价格远低于GPT-4o”的中间价格带[8]。成本敏感型场域的核心竞争壁垒是推理成本优化能力和开发者生态,除了DeepSeek、智谱等国内厂商外,大量开源模型商业化公司也在参与这个场域的竞争。

两个场域的边界正在逐渐固化,客户重叠度极低,预算池也完全独立——高确定性场域的预算主要来自传统企业的IT预算迁移,而成本敏感型场域的预算主要来自创业公司的研发预算和开发者的个人支出,目前尚未出现大规模的跨场域客户迁移。

叙事边界与待验证的核心指标

需要明确的是,当前的两组信号都不构成全行业的普遍性拐点,无法推导出“大模型估值进入万亿美元区间”“大模型API价格战全面爆发”等泛化结论。

首先,Anthropic的估值传闻仅代表一级市场对头部企业级AI厂商的定价预期,不代表其技术能力或业务规模已经确定性超越OpenAI,也不代表所有大模型厂商的估值都会水涨船高。一方面,其估值是谈判中的预期值,与OpenAI已交割的实际估值不具备可比性;另一方面,其高估值的支撑因素包括一级市场的资产稀缺性、云厂商的战略投资需求等非基本面因素,无法复制到其他中小厂商身上。对于绝大多数非头部大模型厂商而言,一级市场的融资窗口仍在持续收窄,估值也处于下行通道,行业的马太效应还在进一步加剧。

其次,DeepSeek的降价也不代表大模型整体推理成本进入了下行通道,更不意味着全行业的价格战已经爆发。一方面,MoE架构的降本路径无法直接复制到稠密架构的大模型上,不同架构的成本结构差异极大,单款模型的降价不能代表全行业的成本下降;另一方面,目前头部厂商的企业级API价格并未出现松动,OpenAI、Anthropic的旗舰模型API价格甚至因为供给紧张而出现了大客户排队的情况,降价仅发生在长尾市场的中低端产品上,并未波及高价值的企业级市场。此外,MoE模型在复杂推理任务上的性能衰减问题尚未完全解决,高并发场景下的稳定性也有待验证,降价后的商业可持续性仍需要时间检验。

要判断当前的叙事会不会演变成确定性的行业趋势,不能依赖市场传闻和厂商的单方面披露,需要追踪四类可验证的硬数据: 第一是Anthropic相关的确定性数据:包括本轮融资完成后的官方估值披露、2026年Q2经审计的实际营收和净利润数据、年付费超100万美元的大客户续费率,以及IPO时的实际发行估值。如果最终融资完成后的估值显著低于9000亿美元,或是Q2营收、盈利数据不及预期,那么当前的高估值叙事将不攻自破。 第二是DeepSeek降价后的运营数据:包括第三方监测机构发布的付费调用量增长数据、高并发场景下的API可用性和性能一致性指标、年预算超10万人民币的企业客户数量变化,以及本轮融资的实际交割金额和估值。如果降价后付费调用量的增长远低于总调用量的增长,或是没有出现大规模的企业客户迁移,那么降价的商业价值将大打折扣。 第三是头部厂商的同口径对比数据:包括OpenAI IPO时的发行估值、OpenAI与Anthropic的单季度企业级营收同口径对比、两家厂商的单位推理成本和毛利数据。只有同一时间节点、同一统计口径的对比数据,才能真实反映两家厂商的竞争力差距。 第四是全行业的预算迁移数据:即大模型行业的新增收入中,有多少是从传统软件、云服务的IT预算池子里转移而来,而非行业内部的存量博弈。如果没有持续的跨行业预算迁移,无论是高估值还是降价,最终都只会变成行业内部的零和博弈,无法支撑整个行业的长期增长。

当前的大模型行业,正处于从技术研发主导转向商业落地主导的关键节点。无论是9000亿美元的估值传闻,还是四分之一的API降价,本质都是行业进入成熟期之前的定价试探——资本在给“企业级AI的确定性”定价,创业者在给“长尾开发者的性价比”定价。但所有定价的基础,最终都要落到可验证的营收、成本和客户留存数据上。在硬数据落地之前,所有的行业叙事都只是市场预期的折射,而非已经发生的事实。对于从业者而言,与其被充满不确定性的传闻带动情绪,不如聚焦于那些能够被验证的核心指标——毕竟,大模型行业的长期价值,从来不是靠估值传闻和价格战撑起来的,而是靠实实在在的客户价值和可持续的商业模型撑起来的。

References

参考资料

Editorial Room
这篇文章怎么过稿
5 位编辑过稿
总编辑主笔
编写方式
总编辑主笔
校稿清单
9/9
资料引用
12 条
编辑席
技术编辑

先把这两个看似无关的资本和市场动作,拆成两个可验证的技术问题:DeepSeek的API永久降价是不是真的来自大模型推理成本的工程化下降,Anthropic的高估值是不是有排他性技术布局的支撑。当前可以确认的技术逻辑是,大模型行业的竞争已经从单一的模型能力对标,转向推理成本的规模化兑现和长期算力资源的排他性锁仓,但两者的核心技术支撑都存在未公开的关键缺口,无法直接推导为全行业的技术拐点。 从已披露的技术细节看,DeepSeek V4-Pro采用1.6万亿总参数、单次推理仅激活490亿参数的MoE架构,官方同步公布API输出速度达400tokens/s、缓存命中成本削减90%,这符合稀疏大模型的成本优化逻辑——同等推理效果下,MoE的激活参数量仅为同能力稠密模型的1/3到1/4,理论上单位token的推理成本可同步下降,稀疏计算加缓存优化的组合确实有能力支撑75%的降价幅度。但目前缺失三类关键验证证据:一是第三方独立实测的全负载吞吐、延迟数据,以及不同任务复杂度下的性能一致性数据,无法确认降价后模型在长上下文、复杂代码推理等场景下没有出现性能衰减;二是单位百万token对应的GPU小时消耗、带宽成本等核心核算指标,无法区分降价是工程降本的真实结果还是阶段性的市场补贴策略;三是“调用量居全球首位”的第三方流量验证数据,现有信源均为官方表述,没有独立监测数据支撑。 Anthropic的高估值对应的技术布局,目前可验证的只有其至2029年总价值450亿美元的算力锁仓协议,覆盖22万GPU,同时引入Andrej Karpathy牵头预训练加速研究,计划用Claude模型优化预训练流程。但核心技术支撑同样存在缺口:一是Claude系列模型的单位推理成本结构从未公开,仅公布Q2营收预期和盈利目标,未披露算力、运维、带宽等刚性成本占比,无法确认盈利是来自技术降本还是高溢价的企业级订单补贴;二是用大模型加速预训练的技术路线仍处于早期研究阶段,目前只有入职信息,没有公开的实验数据或架构细节证明该方案能带来可规模化的训练效率提升,无法支撑估值对应的技术代差预期。 换到工程现场看,两者的能力兑现都对应刚性代价。DeepSeek的MoE架构虽然推理成本更低,但稀疏计算的路由调度、负载均衡、故障容错的运维复杂度远高于稠密模型,目前官方未公开高并发场景下的SLA承诺,若调用量真的达到全球首位,峰值负载下的算力调度成本、稳定性风险都会同步上升,当前定价是否能覆盖全场景成本仍存疑。而Anthropic的算力锁仓本质是刚性支出承诺,哪怕后续营收不及预期、或技术路线迭代导致现有GPU利用率下降,450亿美元的合同仍需履约,这构成了其技术扩张的硬约束,甚至可能限制其后续转向更高效的新架构的灵活性。 反过来看,两个事件都不构成全行业的技术普适性结论。DeepSeek的MoE降本路径无法直接复制到稠密架构的大模型上,且MoE模型在复杂推理任务上的性能衰减问题尚未完全解决,不能因为单款模型降价就判定大模型整体成本进入下行通道。Anthropic的估值增长更多来自算力排他性布局和市场预期,而非已经验证的技术代差优势,其预训练加速等前沿技术的落地周期存在高度不确定性,无法直接推导为其技术能力已超越同行。 后续需要追踪的可验证指标非常明确:对DeepSeek,要关注第三方机构发布的V4-Pro基准测试性能与降价前的一致性数据、单位百万token推理成本的独立核算、高并发场景下的API可用性指标;对Anthropic,要关注其公开财报中的毛利结构、预训练加速方案的技术论文或开源实现、22万GPU的实际利用率数据。只有这些指标落地,才能判断当前的资本和市场动作到底是技术进步的结果,还是行业周期的阶段性表现。

过稿轨迹
挑选题查资料分头看碰一下写稿子挑刺gate_reviewresearch_retry写稿子挑刺gate_reviewrepair_revision改稿子收尾
校稿清单
篇幅是否够讲透有没有反对意见资料够不够宣传腔是否清掉引用是否标清结构是否清楚证据是否撑得住内部讨论是否收住视角是否单薄
被压下去的反对意见
差评君awareness

建议删除Anthropic估值传闻的全部分析内容,认定为不实信息

为什么没放进正文:该传闻为全球AI一级市场广泛传播的公开信号,虽无官方验证但具有行业情绪与资本动向的参考价值,仅需强化“传闻属性”标注而非直接删除

Reader Signal

这篇文章对你有帮助吗?

只收集预设选项,不开放评论,不公开展示个人反馈。

选择一个判断,也可以附加一个预设标签。

发布于 2026-05-25 18:20:55。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。