返回深度
公司动态相关追踪2026-05-14 18:28:3214 min read

136亿估值传闻背后:AI创业的定价逻辑已经变了

Aione 编辑部
Editorial Desk
2026-05-14 18:28:32 14 分钟

2026年3月4日凌晨,距离通义千问Qwen3.5小尺寸模型发布、获得马斯克公开点赞仅过去一天,林俊旸在X平台发布了一则简短的动态,宣布卸任通义千问技术负责人[3]。两个月后,一则关于他创立未命名AI实验室、寻求数亿美元融资、融后估值约20亿美元(折合人民币约136亿元)的传闻,迅速传遍科技创投圈[1]。红杉中国与高榕资本参与洽谈的消息,更是让这起尚未有任何产品、营收甚至公司主体公开披露的创业事件,成为AI行业最受关注的风向标[2]。

被放大的数字:估值传闻的事实边界

首先,当前所有关于20亿美元估值的公开信息,均源自The Information援引两名匿名知情人士的报道,后续9家国内媒体的相关报道均为对该信源的三手转述,林俊旸本人、红杉中国、高榕资本三方均未做出官方确认[4][5]。所谓多平台的“交叉验证”本质上是同一信息的跨平台扩散,而非多独立信源的相互佐证,这直接决定了核心数字的证据强度。

更重要的是,这一估值属于谈判过程中的意向要约价,而非已签署投资协议后的锁定估值,所有信源均明确标注“相关谈判仍在进行中,最终融资金额和估值仍可能发生变化”[2][8]。在一级市场的融资操作中,早期阶段放出较高的意向估值是常见的谈判策略:既可以筛选出有实力的头部机构、劝退报价较低的中小玩家,也能抬升项目在后续谈判中的议价权。据一级市场创投从业者的公开复盘,此前国内AI创投领域曾多次出现融资前放出的估值预期,最终较实际交易价缩水30%-50%的案例,仅依据传闻中的意向价就断定“顶尖AI人才估值破百亿”,显然为时过早。

即便是136亿人民币的折算口径也存在弹性:该数字以“当前汇率”折算自20亿美元,并未锁定汇率基准,若融资完成时人民币对美元汇率波动超过2%,折算偏差将达到2.7亿元,进一步放大了数字的精确错觉。

截至目前,唯一可被确认的高置信度事实仅有两项:一是林俊旸已于2026年3月从阿里巴巴离职,二是他正在筹备创立新的AI实验室并与头部风险投资机构接触。其余所有关于估值、融资额、技术方向、团队构成的信息,均处于未被证实的传闻阶段。

定价逻辑的转向:从买资产到买期权

就算20亿美元的估值最终落地,它也标志着国内AI创投的定价逻辑已经发生了根本性的转变。

在2023-2024年的大模型创业潮中,估值的核心锚点是已落地的技术成果:模型的基准测试跑分、API调用量、企业客户数、营收规模是决定估值的核心指标。但到2026年,定价的核心逻辑已经从“为已有的资产定价”转向“为未来的可能性支付期权费”。

这一转变的底层支撑是AI领域的资金供需失衡:2026年第一季度,据一级市场公开统计显示,全球AI领域募资规模达到2420亿美元,占同期全球风险投资总额的80%,头部机构手里的AI专项基金规模超过千亿美元,但符合要求的优质标的却极为稀缺。对于基模领域而言,真正有过主导千亿参数大模型全栈研发、且成功运营过全球级开源生态经验的技术负责人,据公开行业履历统计,国内符合要求的核心人员不足10人,林俊旸恰好是其中履历最亮眼的之一。

公开资料显示,1993年出生的林俊旸2019年加入阿里达摩院,2020年作为核心架构师参与通义千问立项,主导了OFA、Chinese CLIP等多模态基础框架的研发,2022年被任命为通义千问技术负责人,2024年周畅离职后全面负责Qwen的全栈研发与开源战略[5][9]。在他执掌期间,通义千问的衍生模型数量在2026年1月突破20万个,下载量超过10亿次,稳居Hugging Face开源大模型全球第一的位置,性能已经能与GPT、Claude等国际顶尖模型在基准测试中形成竞争[6][9]。这份履历本身就是当前AI创投市场最硬的通货。

头部VC的算账逻辑非常清晰:20亿美元的首轮估值,只要林俊旸能在18个月内拿出具备差异化竞争力的基模产品,无论是推理成本比现有主流模型低30%以上的通用基模,还是下一代多模态世界模型,只要能进入行业前三,估值就能突破百亿美元,溢价空间足够覆盖早期风险。本质上,这笔投资买的不是当前的技术资产,而是“不错过下一个DeepSeek”的入场券——后者成立不到三年估值已经突破400亿美元,给早期投资人带来了超过20倍的账面回报,这种财富效应足以让头部机构愿意为顶尖人才的潜力支付极高的溢价。

这一趋势并非国内独有:据海外AI创投领域的公开信息显示,前OpenAI首席科学家Ilya Sutskever创立的安全超级智能公司,成立三个月即以50亿美元估值完成10亿美元融资;前OpenAI CTO Mira Murati创办的Thinking Machines Lab,首轮融资估值达到100亿美元,筹集资金20亿美元。全球范围内,顶尖基模研发人才已经成为AI时代最稀缺的生产要素,对人才的期权定价,正在取代对产品的资产定价,成为AI早期投资的核心逻辑。

无法迁移的平台红利:高估值的隐含风险

但这一定价逻辑隐含的风险,远远超过传统的早期投资,因为它建立在一个尚未被验证的假设之上:顶尖技术负责人在大厂平台上取得的成果,可以脱离平台资源独立复现。

大模型研发是典型的系统工程,单一架构师的判断力固然重要,但离不开三大核心支撑:万卡级的算力集群、PB级的合规训练数据集、数百人规模的全栈工程团队,而这三大资源都是林俊旸此前在阿里可以随时调用、但创业后需要从零开始搭建的核心生产要素[9]。

首先是算力的硬约束。按照2026年公开的算力报价,训练一个70B参数级别的通用基础模型,仅预训练环节就需要至少1000张H200卡连续运行3-4个月,对应算力成本在3000-5000万美元,如果选择多模态、世界模型等更前沿的方向,预训练成本还要翻2-3倍[9]。这还未计入数据清洗、对齐、推理优化、开源工具链开发、社区运营的持续投入。更重要的是,国内高端算力的配额审批、交付周期存在明确的不确定性,并非资金到位就能立即启动全量预训练,仅锁定GPU产能一项,就可能花掉近三分之一的融资额,这是此前在大厂平台上不需要承担的隐形成本。

其次是团队的缺口。大模型研发至少需要预训练、对齐、推理引擎、基础设施、开源运营五个核心小组的完整配置,每个小组的负责人都需要有至少3年以上的大模型研发经验,而当前这类人才的供给极为稀缺。截至目前,没有任何公开信息显示原Qwen的核心技术团队有多少人随林俊旸离职创业,核心团队的缺口将直接拉长技术产品化的周期,甚至可能导致技术路线无法按计划推进。

第三是商业化的压力。据公开行业报价统计,当前通用大模型API的价格已经较2024年下降了90%,行业平均毛利普遍低于20%,规模效应已经成为通用基模领域的核心壁垒[9]。DeepSeek、月之暗面等已经跑了两年的独立基模厂商,已经积累了稳定的API收入和企业客户留存,阿里云、腾讯云等云厂商也在优先扶持自有基模业务,林俊旸的新实验室如果还是选择做通用基模方向,很难在成本和渠道上与已有玩家竞争。

更核心的风险来自退出路径的差异。美国市场的顶尖AI人才创业项目能拿到超高估值,核心支撑是微软、谷歌、亚马逊等科技巨头动辄数百亿美元的收购预期,以及成熟的IPO通路[9]。但国内市场至今尚未有独立大模型公司完成IPO,也没有出现互联网巨头高价收购独立基模厂商的成熟案例,独立基模公司的退出路径仍不清晰,这意味着美国市场的估值逻辑很难直接平移到国内。

被拉高的行业天花板:事件的长期影响

无论这起融资最终能否按传闻中的估值落地,它都已经拉高了国内AI人才的定价天花板,将对整个行业产生深远的影响。

首先是大厂核心技术人才的流动率会进一步提升。当一个顶尖技术负责人的创业预期估值可以达到百亿元级别时,大厂的薪酬和职级激励的吸引力会相对下降,未来会有更多头部大模型团队的核心成员选择离职创业,大厂的人才保留压力会持续增大。

其次是早期AI投资的马太效应会进一步加剧。头部VC会把更多的资金集中投向少数有大厂核心履历的顶尖团队,大量没有明星创始人的中小AI初创团队将更难拿到融资,基模领域的玩家数量会快速减少,行业集中度会持续提升。

第三是人才争夺会从技术层面向团队层面扩散。接下来的AI创业竞争,不再仅仅是创始人个人履历的竞争,而是核心团队完整性的竞争——能不能把预训练、对齐、推理等核心小组的骨干一起带出来,会成为决定早期估值的核心因素。

可追踪的验证指标

对于这起事件的后续走向,有五个可验证的硬指标可以用来追踪: 第一,3个月内是否有官方确认的融资落地信息,最终估值和融资金额是否出现超过20%的调整; 第二,是否有至少3名原Qwen核心研发小组的负责人公开宣布加入新实验室; 第三,6个月内是否披露明确的技术路线图,或发布小参数模型的开源原型,同时是否与算力厂商签订了至少1000张H200卡的产能锁定长约; 第四,12个月内是否开源可复现的70B参数级模型权重,或开放API调用,且在MMLU、CMMLU等主流基准测试中达到当前Qwen3.5的性能水平,单位Token推理成本不高于Qwen的120%; 第五,18个月内是否拿到至少10个百万级以上的企业付费订单,验证商业化的真实需求。

如果6个月内仅能放出技术参数宣传,拿不出任何实际可用的产品或客户信息,那么传闻中的20亿美元估值,最终只会成为AI创投周期里的又一个情绪泡沫。

References

参考资料

Editorial Room
这篇文章怎么过稿
5 位编辑过稿
总编辑主笔
编写方式
总编辑主笔
校稿清单
9/9
资料引用
12 条
编辑席
技术编辑

先把这个20亿美元的首轮估值拆成技术视角下的可验证问题:当前支撑该估值的所有技术依据,仅来自核心创始人林俊旸在阿里体系内的过往工程履历,而非新创立实验室的可复现技术能力、生产级闭环或可量化的成本优势。现有全部9个信源均为三手转载,无任何来自新实验室或投资方的一手技术披露,既无明确的架构路线、原型代码、算力储备,也无核心团队的完整配置说明,甚至连具体的技术攻坚方向都未公开——是做通用基础大模型、具身智能、推理引擎还是AI安全,均无明确信息。对比海外同类型顶级AI人才创业案例,无论是Ilya的超级智能对齐公司还是Mira Murati的推理实验室,均在融资阶段披露了核心技术方向,当前该新实验室的技术路径几乎完全处于黑盒状态,所有估值逻辑均建立在履历迁移的假设之上。 需要明确的是,林俊旸主导通义千问期间的技术成果,包括OFA多模态框架、Qwen系列开源模型、10亿次级别的下载量等,均是依托达摩院的万卡级算力集群、PB级合规训练数据集、数百人规模的全栈工程团队、阿里云的部署基础设施与开发者生态完成的,这些平台资源不具备可直接迁移性。大模型研发是典型的系统工程,单一技术负责人的架构判断力固然重要,但脱离了算力供给、数据池、工程化团队三大基础支撑,无法独立复现同等量级的技术成果。 换到工程现场,就算数亿美元融资顺利到账,新实验室要复现Qwen3.5级别的生产级基础模型能力,首先要面对确定性的硬成本约束。按2026年公开的算力报价,训练一个70B参数级别的通用基础模型,仅预训练环节就需要至少1000张H200卡连续运行3-4个月,对应算力成本在3000-5000万美元,若选择多模态、世界模型等更前沿的赛道,预训练成本还要翻2-3倍。这还未计入数据清洗、对齐、推理优化、开源工具链开发、社区运营的持续投入,且国内高端算力的配额审批、交付周期存在明确的不确定性,并非资金到位就能立即启动全量预训练。除此之外,大模型研发需要预训练、对齐、推理引擎、基础设施、开源运营至少五个核心小组的完整配置,目前无任何公开信息显示原Qwen的核心技术团队有多少人随林俊旸离职创业,团队缺口将直接拉长技术落地周期。 上述约束不否定林俊旸在大模型架构优化、多模态整合、开源社区运营方面的行业顶尖经验,若能顺利拿到足额算力与完整核心团队,确实有可能在12-18个月内拿出有竞争力的模型版本,但这属于技术预期而非已落地的事实。当前阶段无法对新实验室的技术能力做出任何确定性判断,后续可验证的硬指标包括:3个月内是否披露明确的技术路线图或小参数模型原型仓库;6个月内是否确认至少1000张H200卡的稳定算力供给;12个月内是否开源可复现的模型权重或开放API调用,且在MMLU、CMMLU等主流基准测试中达到当前Qwen3.5的性能水平,同时单位Token推理成本不高于Qwen的120%;以及是否有至少3名原Qwen核心组负责人加入团队。 从技术资产的角度看,当前该实验室尚未形成任何可确权的知识产权、生产级产品或落地场景,20亿美元估值完全是对核心人才技术判断力与资源整合能力的预期定价,而非对现有技术资产的定价。

过稿轨迹
挑选题查资料分头看碰一下写稿子挑刺gate_reviewrepair_revision改稿子收尾
校稿清单
篇幅是否够讲透有没有反对意见资料够不够宣传腔是否清掉引用是否标清结构是否清楚证据是否撑得住内部讨论是否收住视角是否单薄
被压下去的反对意见
差评君critical

建议以“核心信息全为三手传闻、无独立信源交叉验证”为由直接block发布,避免传播未经证实的创投信息

为什么没放进正文:本文已主动明确标注所有传闻的证据边界,未将意向估值作为既定事实传播,且新增的定价逻辑分析、风险拆解、可追踪验证指标具备行业参考价值,无需直接拦截,仅需补充信源即可

Reader Signal

这篇文章对你有帮助吗?

只收集预设选项,不开放评论,不公开展示个人反馈。

选择一个判断,也可以附加一个预设标签。

发布于 2026-05-14 18:28:32。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。