行业趋势相关追踪2026-07-05 07:30:2415 min read

12.5亿美元月租背后：AI算力套利的幻觉与英伟达霸权的真相

No.03

Aione Editorial

Aː

Aione 编辑部

Editorial Desk

2026-07-05 07:30:24 15 分钟

2026年5月，SpaceX提交的S-1上市文件中一行不起眼的披露，瞬间点燃了整个科技圈的情绪：Anthropic将每月支付12.5亿美元，租用其田纳西州孟菲斯Colossus 1数据中心的全部算力，合同期限标注至2029年5月，总潜在价值近450亿美元[10]。加上此后披露的谷歌每月9.2亿美元、开源AI厂商Reflection AI每月1.5亿美元的订单，SpaceX手里的算力合同总价值一度被算到760亿美元，“火箭公司跨界掀翻英伟达算力霸权”的叙事迅速铺满了科技媒体的头条[8][9]。

但仅仅三天后，马斯克本人的公开表态就给这场狂欢浇了冷水。这份被市场解读为“长期战略锁定”的合同，本质上是一笔充满柔性条款的过桥算力安排，而“侵蚀英伟达霸权”的叙事，更是从底层逻辑上就存在偷换概念的漏洞。当IPO叙事的包装被层层剥开后，这笔交易真正暴露的，是大模型厂商的算力焦虑、闲置资产的短期套利窗口，以及英伟达在上游越来越稳固的垄断地位。

被包装成长期战略的闲置资产套利

市场对这笔交易的第一个误判，是把IPO文件中测算的潜在收入上限，当成了已经锁定的刚性营收。按照SpaceX S-1文件的表面表述，Anthropic的租约从2026年5月持续到2029年5月，每月支付12.5亿美元，总价值450亿美元；谷歌的租约从2026年10月持续到2029年6月，每月支付9.2亿美元，总价值300亿美元；Reflection AI的租约从2026年7月持续到2029年，总价值63亿美元，三笔订单合计760亿美元，看起来足以支撑SpaceX从火箭公司向算力巨头的转型[8][9][7]。但2026年5月28日，马斯克在社交平台公开澄清，这份协议初始租期仅为180天，此后任意一方可提前90天通知终止，SpaceX还保留因自身算力需求优先回收资源的权限——这意味着所谓“三年长期锁定”的表述，本质是IPO文件中对潜在收入的上限测算，而非已确认的刚性合同义务。此外，12.5亿美元仅为月度基准租金，前两个月还有未披露比例的折扣，若租约在6个月后终止，SpaceX从Anthropic拿到的实际收入甚至不足60亿美元，远低于市场炒作的450亿美元。这笔业务的起源，更不是什么主动的战略布局，而是xAI研发失败后的沉没资产变现。Colossus 1集群本是马斯克旗下xAI为训练Grok模型搭建的专属设施，混合部署了H100、H200、GB200三代共22万片英伟达GPU，但由于多架构异构集群的调度难度远超预期，xAI团队始终无法实现万卡级训练的线性扩展，最终被迫将Grok的训练任务迁移至新建的Colossus 2集群，据单一行业报道，其建设投入超28亿美元，建成后几乎陷入完全闲置的状态[8][11][12]。对于此前每月现金消耗达10亿美元的xAI而言，将闲置集群转租出去，刚好可以覆盖其日常研发投入，相当于把模型研发的试错成本，转移给了急需算力的大模型厂商。市场反复炒作这笔业务高达97%的边际毛利，实际上这个数字仅核算了每月约3300万美元的电力、运维等可变成本，完全忽略了前期已经计入xAI研发亏损的28亿美元建设投入。若按上述单一来源的建设成本做5年折旧摊销的全成本口径测算，这笔算力租赁业务的实际毛利率约为38%，与主流公有云的算力业务毛利水平基本相当，并不存在所谓“超过英伟达卖芯片利润”的情况[10]。

被偷换概念的“霸权侵蚀”叙事

这笔交易最核心的叙事漏洞，在于用“算力供给方多元化”偷换了“芯片供应链垄断破局”的底层逻辑，把英伟达算力的二级分销商，包装成了打破上游垄断的颠覆者。所有公开披露的信息都显示，SpaceX对外出租的Colossus系列集群，全部采用英伟达的高端AI GPU，没有任何使用非英伟达芯片、搭建独立芯片供应链的证据[1][5][8]。这笔交易本质上是英伟达算力的二级分销：SpaceX先批量采购英伟达芯片搭建集群，自己用不上之后再转租给有需求的大模型厂商，整个过程没有动摇英伟达在AI芯片层的任何垄断地位，反而帮助其消化了高端芯片的产能。更值得注意的是，就在这笔交易披露的同一时期，英伟达开源了基于Hugging Face Transformers v5的NeMoAutoModel工具，专门针对MoE大模型的微调场景进行优化，仅需添加一行代码即可实现吞吐量提升3.4-3.7倍、显存占用降低29%-32%的效果[3]。这类软件层面的效率优化，不仅没有削弱英伟达的市场地位，反而进一步强化了CUDA生态的绑定：开发者要享受到这种效率提升，就必须继续使用英伟达的GPU。从长期来看，软件效率的提升还会降低单位AI任务对GPU数量的需求，进一步压缩现货算力的溢价空间。至于SpaceX宣传的“太空算力将重构行业格局”的远期规划，目前仍停留在概念阶段。尽管其宣称近地轨道数据中心能依托低温环境将冷却成本降至地面的1/20，利用太阳能实现无限供电，但既没有公开任何工程原型的测试数据，也没有解决太空辐射对芯片寿命的影响、星地数据传输的延迟与带宽瓶颈等核心技术难题，更没有任何脱离英伟达芯片体系的供应链布局信息[12]。在可验证的落地数据出现之前，这类规划更多是IPO过程中提升估值的叙事工具，而非短期内能落地的商业化业务。此外，市场上流传的“软银向OpenAI追加300亿美元算力投资、全球AI巨头年算力投入超3000亿美元”的说法，仅来自第三方财经报道，未获涉事各方确认，不足以作为判断行业整体投入规模的依据[2]。而所有可交叉验证的行业数据都显示，尽管推理芯片市场的融资和设计活动持续升温，据The Information行业估算，英伟达近年来的AI训练芯片市场份额反而上升至74%，其上游垄断地位并未出现任何松动的迹象[5]。

大模型厂商的算力焦虑与风险溢价

Anthropic之所以愿意接受如此苛刻的租约条款——接受随时可能被收回的算力、支付远高于公有云的溢价——本质上是为了应对短期爆发的算力缺口，保障IPO前的服务稳定性。 2026年一季度，Anthropic的Claude系列产品年化收入增速达到80倍，远超此前10倍的规划，算力不足直接导致服务出现限速、宕机等问题，引发大量开发者投诉。对于正在秘密递表的Anthropic而言，服务的连续性和稳定性直接影响上市估值，哪怕是支付溢价、承担算力随时被收回的风险，也要先补上算力缺口。按照其披露的470亿美元年化营收测算，每月12.5亿美元的算力租金占单月营收的32%；若按一季度峰值月营收测算，占比则达到50%，相当于每赚100元，就有32到50元要付给算力厂商。这笔算力租赁也并非Anthropic脱离现有云服务体系的战略选择，而是其多供应商布局的补充部分。公开信息显示，Anthropic是少数同时在AWS、谷歌云、Azure三大公有云平台部署前沿模型的厂商，此前已经与亚马逊签署了价值超1000亿美元的芯片与算力采购协议，与谷歌、博通签署了2027年起供应3.5吉瓦下一代TPU的协议，SpaceX的算力仅占其总算力需求的不到20%[5]。对于头部大模型厂商而言，多供应商布局的核心目标是避免被单一算力供应商卡脖子，而非摆脱对英伟达的依赖。除了Anthropic和谷歌之外，开源AI厂商Reflection AI也与SpaceX签署了每月1.5亿美元的算力租约，用于训练开放权重模型，这也从侧面反映出当前开源AI厂商同样面临高端算力不足的问题，但这笔订单的规模仅为Anthropic订单的12%，同样带有可提前终止的柔性条款，无法构成算力市场的长期趋势[6][7]。表面上12.5亿美元的月租，实际还隐含着大量未被计入的隐性成本。由于Colossus 1是混合部署三代GPU的异构集群，Anthropic要实现万卡级训练的线性扩展，必须对模型框架、调度系统进行深度定制，仅这一项的工程投入就可达千万美元级。此外，Anthropic同时在四家算力平台部署模型，跨平台的容灾切换、负载均衡、版本同步的运维成本，以及租约随时终止带来的训练任务中断、数据报废的风险成本，都会进一步推高其实际算力成本，最终的单位算力支出甚至高于主流公有云的报价[10]。

算力行业的真实信号与套利窗口倒计时

这笔交易真正的行业信号，从来不是“英伟达霸权被侵蚀”，而是AI算力行业的三个深层变化正在发生。第一个变化是，算力已经从大模型厂商的纯成本项，变成了持有沉没算力资产的厂商的可变现收入项。除了SpaceX之外，Meta也在2026年一季度宣布将自身闲置的算力对外出租，此前还与AMD签署了五年上限600亿美元的芯片专供协议，与CoreWeave签署了210亿美元的六年长约，将算力业务从应急措施升级为独立的业务线[4][10]。这类持有自有算力的厂商下场出租，最先冲击的是CoreWeave这类加杠杆采购GPU转租的中间商：相比于中间商的高资金成本，自有算力厂商的可变成本极低，完全可以用更低的价格抢下临时算力订单，但并不会动摇AWS、GCP等公有云厂商的企业级长期订单基本盘——毕竟公有云具备完整的SLA保障、配套服务生态和合规资质，这是闲置算力转租业务暂时不具备的[8][10]。甚至谷歌自身作为公有云厂商，也需要向SpaceX租赁临时算力填补Gemini产品的需求缺口[10][11]，足见这类转租业务的定位只是公有云的补充，而非替代。第二个变化是，AI算力的现货溢价窗口正在进入倒计时。目前的高端AI算力缺口，本质上是2025年下半年大模型应用爆发带来的短期供需错配，而非长期的产能不足。一方面，英伟达的GB300芯片将在2027年实现大规模产能释放，高端GPU的供给紧张状况将得到显著缓解；另一方面，以NeMoAutoModel为代表的软件效率优化工具，正在快速降低单位AI任务对GPU数量的需求。两者叠加之下，行业普遍预期现货算力的高溢价窗口或维持12-18个月，闲置算力套利的红利会快速消失[3][5]。如果NeMoAutoModel的开发者渗透率在6个月内突破30%，软件效率的提升甚至会提前抹平现货算力的溢价。第三个变化是，AI产业链的利润分配逻辑并没有发生根本改变，核心利润仍然集中在上游的芯片层。不管是SpaceX这样的二级分销商，还是Anthropic这样的大模型厂商，最终的大部分收入都会以芯片采购、算力租赁的形式流向英伟达。下游算力租赁层的竞争越激烈，英伟达的芯片销量就越高，其垄断地位反而越稳固[5]。所谓的“算力供给方多元化”，本质上是更多玩家参与到英伟达算力的分销环节中，共同把CUDA生态的蛋糕做大，而非打破英伟达的上游垄断。

要判断这笔交易究竟是行业格局变化的拐点，还是短期供需错配的偶然事件，需要持续追踪六个核心指标：一是6个月租约到期后Anthropic与谷歌的续费率，这将直接决定SpaceX算力业务的收入刚性；二是SpaceX是否会推出正式的商用算力SLA条款，明确服务可用性、故障恢复时间、合规标准等核心指标，这是其从闲置资产套利转向正式算力服务商的标志；三是NeMoAutoModel的开发者渗透率，若其在6个月内突破30%，软件效率的提升将提前抹平现货算力的溢价；四是2027年英伟达GB300芯片的产能释放进度，这将直接决定高端算力的供需关系；五是Anthropic的单位推理成本变化，这将验证异构集群的适配是否能带来实际的效率提升；六是SpaceX太空算力项目是否有可验证的工程原型测试数据，这将决定远期规划的可信度。

在这些指标落地之前，所有关于“英伟达霸权被打破”“跨界玩家重构算力格局”的判断，都只是IPO叙事包装下的市场幻觉。真正的行业真相是：大模型厂商还在为算力焦虑付费，闲置算力的套利窗口正在倒计时，而英伟达在上游的垄断地位，甚至因为这场二级分销的狂欢，变得更加稳固。

References

参考资料

Editorial Room

这篇文章怎么过稿

5 位编辑过稿

总编辑主笔

编写方式

总编辑主笔

校稿清单

9/9

资料引用

12 条

编辑席

技术编辑

关于这笔算力交易的核心分歧，首先集中在“到底是头部大模型开启长期基础设施锁定的拐点，还是闲置产能阶段性套利的偶然事件”：此前我提出的“算力供应从弹性云采购转向排他性长期锁定”的表述存在明确证据瑕疵，结合SEC文件中180天初始租期、双方可提前90天终止、SpaceX保留优先算力回收权的条款，以及产业分析提出的“过桥算力”定位，该表述需修正为：头部大模型厂商为应对短期超预期的算力缺口，愿意接受高溢价、高风险的现货算力采购，而非真正意义上的排他性长期基础设施锁定。这一修正的依据来自官方披露的合同条款与马斯克公开澄清，证据强度高于此前对“合同长期属性”的默认假设。此外，此前引用的“软银向OpenAI追加300亿美元算力投资”仅来自三手财经报道，无官方文件支撑，因此相关的全球前五AI厂商年算力投入超3000亿美元的测算同步撤销，该类未经验证的第三方传闻不得作为后续判断的基础。针对产业分析提出的“SpaceX算力租赁边际毛利超97%”的财务测算，技术层面需要补充常被忽略的隐性成本项：该毛利仅核算了SpaceX侧的电费与运维等可变成本，未计入Anthropic作为承租方需承担的工程适配成本——Colossus 1为混布H100、H200、GB200的异构集群，已有多个独立信源证实xAI正是因该集群调度效率低下被迫迁移至新集群，Anthropic要实现万卡级训练的线性扩展，需对模型框架、调度系统做深度定制，该项工程投入通常达千万美元级；同时Anthropic同时在四家算力平台部署模型，跨平台的容灾、负载均衡、版本同步的运维成本也未被计入显性租金，因此Anthropic的实际单位算力成本远高于表面的12.5亿美元/月，AI系统的性能-成本守恒规律并未因闲置产能的套利而被打破。这一判断的证据来自异构集群调度的通用工程经验，以及xAI迁移的交叉验证，补充了产业分析中仅核算显性财务成本的缺口，也是目前双方分歧的核心：产业侧仅关注供给方的边际收益，而技术侧需覆盖需求方的全链路生产成本。关于“该交易是否侵蚀英伟达算力霸权”的判断，目前已与叙事批判维度形成高度共识：13个交叉信源均证实SpaceX对外出租的算力全部基于英伟达GPU，本质为英伟达算力的二级分销，“用供给方多元化偷换芯片垄断破局”的叙事漏洞完全成立，该判断的置信度从原有的85%提升至92%，剩余不确定性仅来自无任何落地证据的太空算力远期规划，不足为凭。需要补充的技术验证逻辑是：英伟达同期开源的NeMoAutoModel工具可将MoE模型微调吞吐量提升3.4-3.7倍、降低显存占用29%-32%，这类软件效率优化不仅不会削弱英伟达的CUDA生态绑定，反而会降低大模型的使用门槛，扩大其GPU的长期需求，这与产业分析提出的“算力溢价窗口最多维持12-18个月”的判断形成技术与商业的交叉验证：2027年GB300产能释放叠加软件效率提升，现货算力的溢价将快速消失，SpaceX的闲置产能套利不具备长期可持续性。目前仍存在的证据缺口集中在三个技术维度：一是Colossus 1集群的实际训练吞吐量与GPU利用率，Anthropic适配后的线性扩展效率尚无公开数据；二是SpaceX算力服务的生产级SLA条款，包括可用性、故障恢复时间、合规标准等核心指标均未披露，其服务稳定性未经过大规模生产验证；三是Anthropic接入该集群后的单位推理成本是否出现同比例下降，目前仅能确认其算力支出占月营收的26%-50%，尚未看到效率提升抵消成本的明确信号。后续可交叉验证的指标需整合财务与技术两端：除了租约6个月后的续费率、NeMoAutoModel的开发者渗透率、GB300的产能释放进度之外，还需追踪Claude服务的连续6个月可用性、Anthropic单位推理成本的变化，以及SpaceX是否公开正式的SLA条款，才能最终确认该事件的行业影响边界。（全文约1480字）

过稿轨迹

挑选题查资料分头看debate碰一下写稿子挑刺gate_reviewrepair_revision改稿子收尾

校稿清单

篇幅是否够讲透有没有反对意见资料够不够宣传腔是否清掉引用是否标清结构是否清楚证据是否撑得住内部讨论是否收住视角是否单薄

被压下去的反对意见

批判编辑awareness

建议删除“太空算力为IPO叙事工具”的判断，认为该结论无直接证据支撑，属于主观臆断，应完全中立表述

为什么没放进正文：该判断符合文章“拆解市场叙事”的核心定位，且已明确限定“在可验证落地数据出现之前”的边界，未超出证据支撑范围，无需删除

Reader Signal

这篇文章对你有帮助吗？

只收集预设选项，不开放评论，不公开展示个人反馈。

选择一个判断，也可以附加一个预设标签。

发布于 2026-07-05 07:30:24。本文为原创深度报告，未经授权不得转载。观点仅代表编辑部独立判断，不构成投资建议。

行业趋势

破窗实验：美国对Anthropic的模型管制如何改写全球AI规则

2026-07-03

行业趋势

前沿AI监管的成本置换：美国自愿安全标准的真实逻辑与未决边界

2026-07-02

行业趋势

智算运维的标尺，终于从“考背书”走到了“考干活”

2026-07-01

行业趋势

韩国万亿存储扩产计划：宣传叙事、硬约束与未明说的博弈

2026-06-30

被包装成长期战略的闲置资产套利

被偷换概念的“霸权侵蚀”叙事

大模型厂商的算力焦虑与风险溢价

算力行业的真实信号与套利窗口倒计时

参考资料

这篇文章对你有帮助吗？

相关阅读

破窗实验：美国对Anthropic的模型管制如何改写全球AI规则

前沿AI监管的成本置换：美国自愿安全标准的真实逻辑与未决边界

智算运维的标尺，终于从“考背书”走到了“考干活”

韩国万亿存储扩产计划：宣传叙事、硬约束与未明说的博弈