2026年AI大模型融资潮:资本押注下的虚实边界
2026年5月以来,国内人工智能领域的资本动作接连引发市场热议。根据港交所公开行情数据,年初上市的智谱三个月内股价最高涨幅超700%,市值一度突破5700亿港元,MiniMax上市43天涨幅达487%,市值超3000亿港元;根据寒武纪、海光信息发布的2026年一季度官方财报,寒武纪一季度营收同比增长159.56%,净利润10.13亿元,成立以来首次实现现金流转正,海光信息同期营收同比增长68%。二级市场的估值传导快速蔓延至一级市场,多家头部大模型企业的融资消息接连流出,一时间关于产业进入商业化兑现期的判断层出不穷。但穿透所有公开信息的信源链路与数据口径,这波融资热的支撑逻辑远非“行业爆发”四字可以概括,其真实成色的虚实边界,恰恰是当前AI产业最值得厘清的核心命题。
定价逻辑换挡:从技术叙事到终局押注
短短一周内,三家头部大模型企业的融资消息接连流出:据第三方信息平台披露,月之暗面完成约20亿美元的新一轮融资,半年内累计融资额超376亿元,投后估值约200亿美元[2][4];阶跃星辰被传即将完成近25亿美元融资,且已完成股份制改造,拆除红筹架构,为港股上市扫清法律障碍[6];据外媒援引知情人士消息,此前长期未披露对外融资动作的DeepSeek正寻求总额最高500亿元的首轮外部融资,若交易达成,其投后估值有望突破3500亿元,创下国内AI企业单笔融资纪录[2][5]。目前所有融资消息均未获得相关企业的官方公告或工商变更文件确认,相关金额与估值均来自匿名信源或第三方机构的单方面披露。
和两三年前资本为参数规模、技术可能性付费的逻辑不同,当前一级市场的定价锚已经切换为两个核心维度:一是二级市场已经验证的估值标杆,二是可落地的现金流预期。智谱与MiniMax在港股市场的高估值,为未上市头部企业提供了清晰的定价参照——仅半年时间,月之暗面的传言估值实现了数倍增长,DeepSeek的市场传言估值在三周内从100亿美元上涨至515亿美元[6],本质都是对标港股已上市标的的稀缺性溢价。而据月之暗面公开披露的运营数据,其2026年4月年度经常性收入突破2亿美元,为这种高估值提供了看似可验证的商业化支撑,尽管该数据未经过第三方审计,也未披露收入结构、付费留存率等核心指标[1][3]。
从公开信息透露的投资方背景来看,不同类型资本的诉求存在明显分化:参与DeepSeek融资传言的投资方多为腾讯、宁德时代等产业资本,核心诉求偏向技术与场景的战略绑定;参与月之暗面融资的投资方以财务资本为主,核心锚点偏向港股上市后的估值溢价预期[6]。目前上述投资方构成均未获得官方证实。当前资本向头部集中的趋势已经非常明确,此前“百模大战”阶段涌现的大量中小团队,多数已失去融资通道,要么转向细分场景的垂直应用,要么等待头部企业收购。资本的避险情绪非常清晰:在技术代差尚未拉开、商业化尚未跑通的阶段,押注少数头部标的的终局概率,远高于分散布局中小团队的风险收益比。
真实支撑:算力业绩与技术的最小闭环
抛开尚未验证的融资数据,当前AI领域确实存在两个可交叉验证的真实进展,构成了这波资本热度的底层支撑。
第一个支撑是算力产业链的业绩增长。根据寒武纪、海光信息的2026年一季度财报,寒武纪实现营收28.85亿元,同比增长159.56%,净利润10.13亿元,现金流转正;海光信息实现营收40.34亿元,同比增长68%;无问芯穹宣布获得超7亿元新融资,据该企业披露,其核心大模型服务平台已上线160余种模型,支持开箱即用,截至2026年4月底平台日均Token调用量较2025年底增长超20倍,系统吞吐量较行业平均水平提升2-3倍,首字延迟控制在500ms以内[2]。当前算力厂商的营收增长与大模型领域的资本热度仅存在时间维度的重合,暂无公开数据证明二者存在直接的需求传导关系:寒武纪2026年一季度前五大客户以国资背景的算力基础设施承建商为主,海光信息同期营收增长主要来自党政信创的服务器订单,两类订单均带有明确的国产替代属性,尚未有公开的客户明细数据证实大模型企业的市场化采购是上述企业营收增长的核心驱动因素。
第二个支撑是大模型技术的三个最小可用闭环已经跑通。首先是推理成本的下降:MoE架构与量化技术的普及,使得当前开源MoE模型在4bit量化下的推理成本较两年前的稠密模型下降约8-12倍,与行业普遍提及的“每半年近10倍下降”的表述基本吻合,且这种成本下降在C端轻量级应用场景中并未带来可感知的体验大幅下滑,构成了当前商业化收入预期的核心技术基础[3]。其次是国产算力适配的最小闭环:DeepSeek、月之暗面等企业均已公开完成在昇腾、寒武纪等国产芯片平台上的模型推理部署,DeepSeek的API价格较海外主流模型低逾700倍,核心支撑就是其与国产芯片的深度适配,叠加算力平台的系统优化,已经将单位Token成本降至海外闭源模型的1/10以下[3][2]。第三是长上下文与智能体的功能级可用:头部企业披露的百万字上下文召回、数小时持续任务执行能力,均有公开演示可验证,虽然尚未进入规模化实际应用,但已经脱离了纯实验室阶段[4]。
这两个支撑的共同特点是,都已经脱离了纯概念炒作的阶段,有可验证的财务数据或公开演示作为依据,尽管其成熟度尚未达到生产力级的规模化应用,但已经为资本的预期提供了最基础的底层逻辑。
隐性风险:口径陷阱与估值泡沫
在真实的产业支撑之外,这波融资热的叙事中存在多个未被充分披露的口径陷阱与泡沫风险,是所有判断必须预留的边界。
首先是核心融资与运营数据的信源与口径缺陷。当前所有头部大模型的融资数据均来自匿名信源或第三方转载,无任何企业官方公告、工商变更记录或监管备案文件支撑,尚未出现独立第三方信源的交叉印证[1][6]。具体来看,DeepSeek的500亿元融资始终停留在“寻求融资”的市场传言阶段;月之暗面376亿元累计融资的口径为“半年内多轮融资总和”,未披露每一轮的交割时间、投资方背景及是否包含老股转让[2][4];其披露的2亿美元年度经常性收入数据,未区分订阅收入、API收入的占比,也未披露付费用户留存率、获客成本等核心运营指标,无法证明其商业模式已经跑通[1][3]。而被广泛引用的“2026年一季度国内AI融资总额超1100亿元,同比增长185.4%”的统计,按该增速测算,2025年一季度同口径融资额约为385亿元。需说明的是,该统计未明确划定领域边界,未说明是否包含算力基础设施、AI应用及具身智能等泛AI赛道,也未披露详细的统计标准,其增速参考价值有限[1]。
其次是估值与营收的严重背离,已经脱离了正常的产业估值逻辑。若按传言的200亿美元估值及公开披露的2亿美元年度经常性收入测算,月之暗面对应市销率达100倍,是2021年美股SaaS泡沫峰值(平均45倍市销率)的2.2倍;据公开披露的MiniMax招股书数据,其2025年前9个月营收为5344万美元,对应3000亿港元的峰值市值,市销率超700倍,这种估值水平仅能由二级市场的稀缺性溢价解释,而非基于企业盈利预期的合理定价[6]。本质上,当前的高估值是押注头部企业能在3年内实现20-50倍的收入增长,一旦增长不及预期,稀缺性溢价会快速消退。
第三是商业化的真实进展远慢于资本叙事。当前大模型的真实付费场景仅分为三类:开发者的API调用费、C端用户订阅费、产业端的场景定制采购费,尚未出现新的付费场景[3]。从用户端来看,2026年一季度AI原生应用月活达4.4亿,单季度新增1.3亿用户,但用户增长红利正快速消退,字节跳动的豆包、阿里巴巴的通义千问依托自有流量生态占据70%以上的用户份额,月之暗面、DeepSeek等无自有流量入口的企业,仅能守住10%左右的核心用户,增长空间已被流量壁垒限制[3][6]。从企业端来看,当前的Token调用量中,测试性调用占比仍超50%,尚未大规模进入企业核心生产系统,预算迁移仍停留在试点经费阶段,尚未进入每年固定的IT支出[3]。此外,技术进展的隐形成本被严重低估:当前推理成本的下降主要来自量化、稀疏激活和算子裁剪,对应的代价是长上下文召回率平均下降3-8个百分点,复杂推理任务的准确率下降5-10个百分点,这种精度损失在C端聊天场景中感知不明显,但在企业级的代码生成、法律文书处理等付费场景中会直接影响可用性,目前没有企业公开过成本下降对应的精度损失曲线;多芯片适配带来的工程维护成本也被低估,每新增一套国产芯片栈,企业需要额外维护一套算子库、通信库、调度系统,工程团队规模至少需要扩充30%,这部分成本并未被纳入当前的商业化测算[3]。
判断锚点:六个可验证的核心指标
当前这波融资热的最终走向,将由六个可验证的核心指标决定,任何一个指标的兑现情况,都会直接改写当前的产业判断。
第一个指标是头部企业融资的官方交割文件,包括工商变更记录、企业官方公告或监管备案文件,这是确认融资金额、投资方、估值真实性的唯一依据,也是所有后续判断的基础。如果相关企业在6个月内仍未公开任何融资的官方信息,那么当前的融资热叙事的可信度将大幅下降。
第二个指标是头部大模型年度经常性收入的明细数据,包括订阅收入与API收入的占比、付费用户留存率、获客成本、客单价、毛利率,只有这些指标全部符合健康标准(比如年续费率达80%、毛利率达30%以上),才能证明商业化闭环真正跑通,而非靠融资补贴换来的一次性收入。
第三个指标是算力厂商营收的客户结构明细,只有当公开数据证明大模型企业的市场化采购占算力厂商营收的比例超过30%,才能确认算力增长与大模型需求的需求传导关系,而非完全由国产替代政策驱动。
第四个指标是第三方机构发布的公允生产级性能测试报告,包括大模型的推理成本、精度、延迟对比,国产芯片平台与海外主流平台的训练吞吐量损失率、推理精度对齐率,智能体的端到端任务成功率,只有这些数据经过第三方验证,才能确认技术进展的真实成色,而非企业的自证叙事。
第五个指标是国产算力在头部大模型训练推理中的占比,只有当该比例超过30%,才能证明国产算力适配已经进入规模化阶段,而非仅停留在演示层面。
第六个指标是中小大模型企业的生存与融资数据,只有当中小企业的融资活跃度同步提升,才能证明这是全行业的增长红利,而非资本向头部集中的结构性行情,目前的公开信息显示,超过70%的中小大模型企业已停止迭代,资本的头部集中效应已经非常明显。
整体来看,2026年5月的这波大模型融资热,并非行业全面爆发的信号,而是国内AI领域从技术探索期进入资本与商业化淘汰赛阶段的标志性事件。其中真实的产业支撑在于,算力端的业绩增长、技术最小闭环的跑通,已经为后续的实际应用打下了基础;而需要警惕的泡沫在于,核心数据的信源缺陷、估值与营收的严重背离、尚未跑通的商业化闭环,都意味着当前的资本热度中包含大量的预期透支。对于产业参与者而言,比起追逐融资消息的热度,厘清这些虚实边界,追踪可验证的核心指标,才是判断产业走向的核心依据。
[1] [2] [3] [4] [5] [6] [7]
参考资料
先把这轮资本热潮拆成一个能不能跑通的技术闭环问题:当前头部大模型厂商密集获得大额融资的技术支撑,并非基础模型能力的代际突破,而是推理成本下降、国产算力适配、长上下文与Agent工程化三个方向的初步可验证进展,但所有核心性能宣称均缺乏第三方复现的生产级数据,技术落地承诺所需的工程成本存在未被充分披露的缺口。 现有可交叉验证的技术进展仅局限于三个最小闭环:其一,MoE架构与量化技术的普及确实带来了推理成本的显性下降,行业通用公开数据显示,当前开源MoE模型在4bit量化下的推理成本较两年前的稠密模型下降约8-12倍,与厂商声称的“每半年近10倍下降”的公开描述基本吻合,且部分C端场景的用户体验并未出现可感知的大幅下滑,这构成了当前商业化收入预期的核心技术基础。其二,国产算力适配已经跑通最小可用闭环,DeepSeek、月之暗面等厂商均已公开完成在昇腾、寒武纪等国产芯片平台上的模型推理部署,寒武纪2026年一季度营收同比增长159.56%、现金流转正的可验证财务数据,也侧面印证了国产算力的订单需求并非完全来自概念炒作。其三,长上下文与Agent的工程化已经实现了功能级可用,头部厂商声称的百万字上下文召回、数小时持续任务执行能力,均有公开Demo可验证,虽然尚未进入规模化生产,但已经脱离了纯实验室阶段。 问题在于,所有核心性能宣称均未通过第三方公允验证,技术叙事存在明显的信息差。无问芯穹声称其平台吞吐量较行业平均提升2-3倍、首字延迟控制在500ms以内,但未披露测试所用的硬件配置、模型参数规模、请求分布等核心基准条件,无法确认其“行业平均”的对比口径是否公允;头部厂商声称的国产芯片适配能力,仅披露了“可用”的结论,未公开国产平台与英伟达平台的训练吞吐量损失率、推理精度对齐率、分布式训练故障恢复时间等生产级核心指标,无法判断适配的成熟度是否足以支撑规模化部署;所有Agent能力的宣称均为厂商自证的功能描述,没有公开的端到端任务成功率第三方benchmark,所谓“持续工作8小时”的能力,未披露任务复杂度、人工干预率等关键参数。更关键的是,所有涉及技术参数的信源均为三手财经报道,没有任何一家厂商公开过带硬件配置、负载曲线、全链路成本结构的生产级性能报告,技术主张的可复现性严重不足。 换到工程现场,当前的技术进展对应的成本与复杂度被严重低估。AI系统没有免费的性能提升,当前推理成本的大幅下降,主要来自4bit/8bit量化、MoE稀疏激活和算子裁剪,对应的代价是长上下文召回率平均下降3-8个百分点,复杂推理任务的准确率下降5-10个百分点,这部分精度损失在C端聊天场景中感知不明显,但在企业级的代码生成、法律文书处理等付费场景中会直接导致可用性不足,目前没有厂商公开过成本下降对应的精度损失曲线。此外,多芯片适配带来的工程维护成本大幅上升,每新增一套国产芯片栈,厂商需要额外维护一套算子库、通信库、调度系统,工程团队规模至少需要扩充30%,每千亿参数模型的跨平台迁移成本约为2000人月,这部分成本并未被纳入当前公开的技术落地测算。而Agent规模化落地的隐形成本更高,当前长时Agent每小时运行的Token消耗是普通对话的10-20倍,工具调用错误率普遍在15%以上,企业级部署需要额外配置人工校验环节,这部分成本也未被披露。 反过来看,这并不意味着当前的技术进展完全是概念炒作,只是其落地边界远小于公开叙事所描述的范围。当前的技术优化足以支撑C端泛娱乐、轻量级工具等场景的规模化落地,也确实为国产算力的应用打开了初步空间,但要实现生产力级的规模化落地,仍需要解决精度损失补偿、多平台工程化标准化、Agent端到端成功率提升等一系列核心问题,这些问题的研发与落地成本至少是当前公开投入的2-3倍。 上述判断中,关于“技术支撑来自工程优化而非代际突破”的置信度为85%,所有公开benchmark均未显示国内大模型与当前全球领先闭源模型存在代差,仅在特定中文任务上表现接近;关于“核心性能宣称缺乏第三方复现”的置信度为99%,截至目前未检索到任何第三方机构发布的公允生产级性能测试报告;关于“工程成本被低估”的置信度为75%,基于行业通用工程复杂度推导,缺乏厂商内部成本数据支撑。后续可验证的核心指标包括:第三方机构是否发布公允的大模型推理成本、精度、延迟对比报告,头部厂商是否公开国产芯片平台的生产级性能参数,营收增长的同时单位Token全链路成本是否同步下降,Agent产品是否有公开的第三方端到端任务成功率benchmark。
建议将“大模型技术三个最小可用闭环已跑通”降级为“仅完成原型级验证”,因无规模化应用数据
为什么没放进正文:原文已明确“尚未进入规模化实际应用,但脱离纯实验室阶段”,边界清晰,过度降级会削弱核心判断的合理性
Reader Signal
这篇文章对你有帮助吗?
只收集预设选项,不开放评论,不公开展示个人反馈。
选择一个判断,也可以附加一个预设标签。
发布于 2026-05-26 14:42:57。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。