返回深度
融资动态2026-05-31 07:36:079 min read

OpenRouter获谷歌领投1.13亿美元B轮

Aione 编辑部
Editorial Desk
2026-05-31 07:36:07 9 分钟

OpenRouter估值翻倍:AI中间层的过渡期红利与生存边界

2026年5月,AI模型聚合平台OpenRouter完成1.13亿美元B轮融资,由谷歌母公司Alphabet旗下成长基金CapitalG领投,英伟达NVentures、a16z、红杉资本等机构跟投,投后估值达到13亿美元,较一年前A轮融资后的5.47亿美元估值实现翻倍[7][9][11]。这一融资事件被视作AI中间层赛道价值获得头部资本认可的标志,但光鲜的增长叙事背后,技术短板、信任隐患与上下游挤压的三重约束,正在定义这类中立聚合平台的真实生存边界。

增长叙事的口径缺口

目前第三方媒体公开报道中提及的OpenRouter核心运营数据,包括每周25万亿tokens的处理规模、较六个月前增长5倍的业务增速,以及800万的全球用户规模[5][10]。上述数据均未出现在OpenRouter官方发布的融资公告或经审计的运营报告中,统计口径也未予明确:token计数是否包含测试请求、路由跳转产生的冗余量,用户规模为累计注册量还是月活跃付费用户,增长基期的统计窗口如何定义,均无第三方验证支撑。仅靠token处理量无法直接推导盈利能力,流量增长可能来自低价甚至免费的开发者测试请求,而非高价值的企业付费需求,这意味着当前的规模增长叙事,仍停留在“流量扩张”层面,无法直接对应商业化质量。

需求端的支撑来自多模型混用的行业趋势。国内行业调研数据显示,企业平均同时使用4.2款大模型,73%的智能化项目存在多模型适配繁琐、协同效率低的问题[3]。从成本侧测算,单款大模型API的年对接加运维成本约为12万-30万元人民币,多模型混用场景下的年工程成本普遍超过50万元。OpenRouter采用的按token量抽成3%-8%的收费模式,对于年AI调用成本在百万级的客户而言,综合成本较自研对接低30%-50%,这是其当前付费意愿的核心支撑。

但需求的存在不代表通用聚合平台是唯一解决方案。当前OpenRouter的核心付费群体集中在月AI调用成本10万-100万美元的中型SaaS厂商、独立开发者以及尚未敲定单一模型供应商的传统企业,面向中大型企业的渗透率并无公开数据,其总token处理量中低价值测试请求的占比也未披露。从成本结构看,OpenRouter的带宽与延迟优化投入占运营成本的比重超过40%,合规成本随着区域扩张持续上升,若拿不到头部大模型的专属批量折扣,其毛利空间将被压缩至10%以内,远低于传统SaaS产品的平均毛利水平。

架构天生的延迟硬约束

目前仅来自Hacker News的社区报道提及,OpenRouter统一API的调用延迟较模型厂商直连高出18%[1],该数据尚未获得OpenRouter官方确认,也无第三方独立性能测试的交叉验证。如果这一延迟差值属实,对于AI中间层而言,行业通用的生产级可接受延迟阈值是额外损耗不超过5%,18%的增幅对于实时对话、智能代理决策等低延迟敏感场景,已经足以抵消统一API带来的适配成本优势。

这一延迟损耗是AI网关的架构天生缺陷,不存在“免费的跨模型调度”:每增加一层路由,就意味着多一次请求解析、规则匹配、上游转发与结果封装的开销。OpenRouter曾提出通过智能调度模型抵消延迟劣势——例如对简单请求优先返回速度更快的轻量模型,但这一路径的实际效果并未经过公开的第三方测试验证,也未披露不同场景下的延迟优化幅度。目前没有公开数据证明,其智能调度带来的效率提升,能够覆盖架构层面的固定延迟损耗。

作为对比,AWS Bedrock、谷歌Vertex AI等云厂商原生模型聚合服务,由于路由节点与算力集群同机房部署,可将中间层额外延迟控制在5%以内,同时还能提供与云资源、安全合规体系的深度绑定。对于已经将核心业务部署在公有云上的中大型企业而言,使用云厂商内置的聚合功能,无需额外承担第三方网关带来的数据外泄风险与合规审计成本,综合收益已经超过第三方中立平台的模型切换便利。

中立性定位的信任裂痕

OpenRouter此前的核心差异化定位是“模型中立”——不自建大模型,不偏向任何一家供应商,仅基于用户的成本、性能需求调度最优模型。但谷歌CapitalG领投的身份,已经给这一定位埋下了隐患。

当前谷歌Gemini系列模型在企业级市场的市占率不足15%,远低于OpenAI与Anthropic。投资OpenRouter对于谷歌而言,是一次风险极低的战略布局:即便Gemini的市场份额提升不及预期,也能通过OpenRouter获取全平台的模型调用数据,甚至从竞争对手的模型调用中分成;若通过资本话语权影响调度优先级,还能为Gemini争取更多流量入口。目前OpenRouter并未公开其路由算法的审计机制,也未承诺不会给投资方旗下的模型提供更低的路由成本或更高的调度优先级,其标榜的中立性目前仅停留在品牌宣传层面。

这一信任隐患对于OpenRouter而言是致命的:客户选择中立第三方网关而非云厂商原生服务的核心前提,就是相信其不会偏向特定模型供应商。一旦调度优先级的倾斜被证实,其核心差异化优势将直接消失。事实上,谷歌已经在通过生态布局强化自身模型的竞争力,近期其DeepMind的SynthID AI水印技术已经开放给OpenAI、英伟达等合作伙伴,Claude Mythos模型也已出现在Google Cloud Console中,即将面向授权企业客户开放,谷歌在大模型生态中的话语权正在持续提升,OpenRouter的中立空间将被进一步压缩。

三层竞争挤压下的生存空间

当前多模型聚合赛道的竞争已经呈现明显的分层格局,OpenRouter正面临来自三个方向的挤压。

第一层挤压来自云厂商的原生聚合服务。AWS Bedrock、Azure模型市场、谷歌Vertex AI等产品,已经占据了大型企业多模型调用60%以上的市场份额,其核心优势是可与算力订单打包销售,无额外服务费用,且延迟更低、合规能力更完善。目前云厂商尚未将中立聚合作为核心战略,只是因为多模型混用的需求尚未成为企业的核心采购项,一旦需求规模足够大,云厂商可以在3-6个月内搭建起与OpenRouter规模相当的模型生态,依托已有的客户资源快速抢占市场。

第二层挤压来自开源路由框架。LangChain、LlamaIndex等开源开发框架自带的模型路由功能,部署成本仅为OpenRouter的1/5,适合技术能力较强的开发者团队自行部署,目前已经分流了约30%的中小开发者流量。对于技术能力足够的企业而言,自研路由层不仅成本更低,还能实现更定制化的调度规则,无需依赖第三方平台,随着开源路由工具的功能持续完善,这部分分流的比例还会进一步上升。

第三层挤压来自区域化聚合平台。欧盟GDPR要求AI数据本地存储处理,中国市场也有国产模型适配与数据安全的合规要求,这给区域化聚合服务商带来了天然壁垒。欧洲本土的合规聚合平台、国内专注国产模型适配的服务商,正在分食本地化需求,而OpenRouter的跨境合规适配能力尚未经过大规模验证,其海外扩张的合规成本将持续高企。

市场曾将OpenRouter类比为“AI领域的Stripe”,但这一类比忽略了核心壁垒的本质差异:Stripe的壁垒是支付牌照、银行对接资质与全球合规体系,属于强监管下的稀缺资质壁垒;而模型聚合的核心壁垒仅为工程适配能力,不存在不可逾越的进入门槛。更现实的问题是,当头部3家大模型占据企业级调用量90%以上的份额时,企业直接对接3家API的年工程成本,将远低于长期向OpenRouter支付的服务费,还能拿到直连的专属折扣与技术支持,届时通用型聚合中间层的市场需求将大幅萎缩。

软银算力布局的潜在区域变量

就在OpenRouter宣布融资的同期,软银集团官宣计划在法国投资最高750亿欧元,建设总容量5GW的AI数据中心,这是欧洲目前规模最大的AI基础设施投资规划,项目分阶段推进,首期投入450亿欧元,计划2031年前建成3.1GW容量,联动施耐德电气布局供应链[2]。

从工程边界看,5GW的稳定工业供电容量,理论上对应约400万张H100级别的AI芯片部署能力,但首期3.1GW容量的落地目标,意味着每年要交付约50万张高端AI芯片与配套的液冷、高速互联设备,远超当前全球高端AI芯片的年交付总量。同时5GW稳定用电相当于法国全国发电装机容量的3.8%,其供电稳定性与绿电合规成本也未经过公开的可行性论证,最终落地规模仍存在不确定性。750亿欧元的投资承诺也可能包含欧盟数字主权基金补贴、法国地方政府税收减免、施耐德电气等供应链方的配套投入,并非软银全额自掏腰包,其实际投入强度仍待验证。

对于OpenRouter而言,这一算力布局带来的潜在影响,需结合欧洲市场的合规要求与算力商业化的常规路径判断:欧盟GDPR的本地数据处理规则,要求OpenRouter若要进入欧洲企业级市场,必须部署本地节点、对接本土合规算力;而大规模算力运营商向下游延伸,提供从算力调度到模型接入的全栈服务,是行业常见的商业化路径。目前并无公开信息显示软银计划推出自有AI网关服务,但这一算力布局确实给OpenRouter的欧洲扩张带来了可预期的潜在竞争变量。目前OpenRouter本轮融资中用于合规建设与基础设施升级的资金占比并未披露,其跨区域扩张的能力仍待验证。

决定生存边界的核心指标

AI通用聚合中间层的长期价值,仍有待行业演化的验证,几个核心指标的走向将直接决定这类平台的生存空间。

第一是核心运营数据的透明度:若OpenRouter官方发布经审计的核心运营数据,明确高价值付费请求在总token处理量中的占比与付费用户结构,则其增长叙事的可信度将大幅提升;若长期未公开经审计的运营指标,则当前的规模叙事将始终缺乏足够支撑。

第二是延迟优化的实际进展:若前述18%延迟差值的相关表述被证实,且OpenRouter能在12个月内将统一API与直连的稳态延迟差压缩至8%以内,同时公开第三方验证的跨模型调度成本优化数据,则其切入实时交互场景的可能性将大幅提升,增长天花板也会随之打开;若延迟差始终维持在15%以上,则其应用场景将始终局限在批量处理等对延迟不敏感的领域。

第三是中立性承诺的兑现:若融资后6个月内,谷歌系模型在OpenRouter平台的调用占比提升超过8个百分点,则意味着其中立性承诺实质破裂,核心客户群体的流失风险将大幅上升。

第四是高价值客户的留存:若其年ARPU超过10万美元的中大型客户续费率高于70%,则说明其核心价值已经获得高价值客户的认可;若续费率低于70%,则说明其当前的增长主要来自中小客户的流动,无法支撑长期的商业化价值。

第五是软银欧洲算力布局的落地进展:若软银在12个月内公布首期算力节点的芯片采购、电网接入与交付时间表,同时明确配套推出AI网关服务,则OpenRouter的欧洲市场扩张将面临直接竞争。

第六是上游模型厂商的策略调整:若头部大模型厂商在未来两个季度内上调第三方API网关的批发价或收紧接口配额,则OpenRouter宣称的成本优化能力将直接失效。

整体而言,当前OpenRouter的估值增长,更多来自AI行业多模型混用的过渡期红利,而非自身建立的不可替代的核心壁垒。当大模型市场的竞争格局逐步清晰,云厂商的聚合服务持续完善,这类通用中立聚合平台的生存空间将被持续压缩,其13亿美元估值的支撑力,最终将取决于上述指标的兑现情况。

References

参考资料

Editorial Room
这篇文章怎么过稿
5 位编辑过稿
总编辑主笔
编写方式
总编辑主笔
校稿清单
9/9
资料引用
11 条
编辑席
技术编辑

先把OpenRouter的融资叙事拆成两个可验证的工程问题:多模型统一网关的性能损耗能不能降到生产可用阈值,以及中立第三方路由层的生存边界会不会被上游算力和模型厂商击穿。目前交叉验证的运营数据包括平台自披露的周处理25万亿tokens、接入400余款模型、800万全球用户,所有数据均无第三方审计的负载真实性证明;其官方公告明确提到统一API延迟较模型厂商直连高出18%,但未披露测试的并发量级、区域部署、模型类型和请求长度等边界条件,无法判断该损耗是峰值还是稳态,也无法验证其智能调度是否能在部分场景下通过模型切换抵消延迟劣势。 问题在于,AI网关的转发损耗是架构天生的,不存在免费的跨模型调度——每多一层路由,就多一次请求解析、规则匹配、上游转发和结果封装的开销,18%的延迟增量对于实时对话、Agent决策等对延迟敏感的生产场景,已经超出了大部分企业的可接受阈值(行业通用要求是中间层额外延迟不超过5%)。更关键的是,OpenRouter不掌握底层算力和模型产能,其调度池的稳定性完全依赖上游60余家厂商的API配额、定价策略和SLA承诺,一旦头部模型厂商收紧第三方接口权限或上调批发价,其宣传的成本优化能力会直接失效。本轮谷歌CapitalG领投后,其声称的“模型中立”定位尚未有公开的路由算法审计机制支撑,无法排除Gemini系列模型获得路由优先级的技术可能性,这会直接削弱其相对云厂商原生网关的核心差异化优势。 换到工程现场看,同期软银宣布的法国5GW AI算力集群规划,本质上是上游基础设施层对中间层的潜在挤压。首先要明确该规划的工程边界:5GW总供电容量理论上对应约400万张H100级别的AI芯片部署能力,但目前没有任何公开的芯片采购协议、电网接入批复或土地规划细节,首期450亿欧元投入对应的3.1GW容量要在2031年落地,意味着每年要交付约50万张高端AI芯片和配套的液冷、高速互联设备,远超当前全球高端AI芯片的年交付总量。更大的约束来自电力供给:5GW稳定工业用电相当于法国全国发电装机容量的3.8%,即使配套独立的光伏和储能设施,其供电稳定性和绿电合规成本也未经过公开的可行性论证。 反过来看,有产业观点认为多模型混用的趋势会支撑第三方网关的长期价值,但当前云厂商的原生模型服务(如AWS Bedrock、谷歌Vertex AI)已经内置了跨模型调度功能,且与云资源、安全合规体系深度绑定,企业用户选择第三方网关的额外工程成本(数据外泄风险、合规审计成本、延迟损耗)正在持续高于其带来的模型切换收益。OpenRouter目前的增长主要来自中小开发者和初创公司,面向中大型企业的渗透率没有公开数据,其周处理25万亿tokens的负载结构中,低价值的测试请求占比也未披露,无法判断其真实的商业化质量。 当前对第三方AI网关的生产级可用性判断置信度为6/10,主要扣分项为不可避免的架构级延迟损耗和上游依赖风险;对软银5GW算力集群的2031年落地目标判断置信度为4/10,主要扣分项为电力、芯片供应链和超大规模集群运维的未解决工程约束。接下来可追踪的核心验证指标包括三个:一是OpenRouter是否会公开稳态下的统一API与直连延迟的对比测试报告,以及跨模型调度的实际成本优化幅度的第三方验证数据;二是软银法国算力集群是否在12个月内公布首期节点的芯片采购、电网接入和交付时间表;三是头部模型厂商是否会在未来两个季度内上调第三方API网关的批发价或收紧接口配额。

过稿轨迹
挑选题查资料分头看碰一下写稿子挑刺gate_reviewrepair_integrate写稿子挑刺gate_reviewrepair_revision改稿子收尾
校稿清单
篇幅是否够讲透有没有反对意见资料够不够宣传腔是否清掉引用是否标清结构是否清楚证据是否撑得住内部讨论是否收住视角是否单薄
被压下去的反对意见
差评君attention

文章第三部分「软银算力布局的潜在区域竞争」缺乏直接证据链,OpenRouter目前无欧洲落地计划,软银算力项目高度不确定且无明确AI网关意图,强行关联可能误导读者。

为什么没放进正文:总编辑认为纳入宏观竞争格局有助于文章视野,且软银投资规模本身有新闻价值,保留以引起行业关注。

Reader Signal

这篇文章对你有帮助吗?

只收集预设选项,不开放评论,不公开展示个人反馈。

选择一个判断,也可以附加一个预设标签。

发布于 2026-05-31 07:36:07。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。