Model Funding2026-07-04 10:18:2514 min read

硅基流动递表港交所：“Token工厂”的叙事校验与未决边界

No.06

Aione Editorial

Aː

Aione 编辑部

Editorial Desk

2026-07-04 10:18:25 14 分钟

以下所有数据均来自港交所招股书片段转述及二手财经媒体，无一手访谈或调研数据。 2026年6月30日，成立不足三年的AI推理基础设施公司硅基流动，以18C未商业化公司身份向港交所递交上市申请，一时间成为行业焦点[1]。一边是“AI卖铲人第一股”“中国最大独立词元供应商”的亮眼标签，另一边是三年累计亏损超4亿元、毛利率转负的争议数据，市场对这一事件的判断呈现出极端分化的态势：一方将其视为AI基础设施领域商业化探索的标杆，另一方则将其看作资本烧钱换规模、急于向二级市场转移风险的样本。

所有判断都需要建立在可验证的证据基础上。现有公开信息大多来自财经媒体对招股书片段的转述，核心数据披露覆盖率不足四分之一，大量宣传口径背后存在明显的定义边界、统计偏差与证据缺口。要穿透叙事包装，需要逐一校验每一个核心主张的证据强度，明确当前判断的适用边界，并给出可证伪的后续验证标准。

被定制的口径：亮眼指标的边界陷阱

首先需要校准的是所有宣传口径的统计边界。硅基流动对外最核心的定位之一是“中国最大的独立生态词元供应商”，这一说法来自弗若斯特沙利文的统计数据，按2025年词元年吞吐量计算，其在独立生态词元供应市场排名第一，全行业市场份额为1.5%[2][5]。但这一头衔的含金量高度依赖“独立生态”这一自定义前提：该统计维度排除了所有云厂商自有推理服务、大模型厂商自有Token供应业务，仅统计第三方独立服务商，而被排除的主体占据了全行业80%以上的市场规模。如果将统计范围扩大到全行业，硅基流动仅排名第四，与头部云厂商的市场规模差距超过一个数量级，所谓“最大供应商”的定位，仅在极窄的自定义维度下成立。

接下来是营收增速的叙事。公开数据显示，硅基流动2025年营收达5533万元，较2024年的735万元增长653%，这一数字常被用来证明其业务的高成长性[2][3]。但这一增速的参考价值需要放在两个背景下重新评估：其一，其增长基期极低，2023年全年营收仅6000元，2024年仍处于业务启动阶段，低基数下的高增速并不代表业务已经进入成熟增长阶段；其二，同一周期内，国内词元供应市场的整体规模增速达1602%，硅基流动的增速不仅没有跑赢行业平均水平，反而落后约950个百分点[5]。这意味着其所谓的高增长，更多是整个行业爆发带来的普惠性红利，而非自身竞争力带来的超额增长，甚至可以说，其市场份额正在被更大的玩家蚕食。

用户数据的披露同样存在信息差。招股书提到，截至2026年4月，平台累计注册用户超过1000万，服务企业客户超过1.3万家[5]。但这两个指标的实际参考价值非常有限：注册用户数仅代表曾经访问过平台的用户规模，无法反映活跃用户、付费用户的数量，更无法体现用户粘性；企业客户数也没有披露付费率、续费率、单客收入分布等核心运营数据。低价甚至免费的补贴活动可以在短期内快速积累注册用户，但无法证明用户愿意为服务长期付费，这是所有To B和To C互联网业务的基本常识，在当前的披露中，这一核心证据处于完全缺失的状态。

最值得关注的反差来自本地部署业务的运营数据。2024年至2025年，硅基流动本地部署业务的客户数量减少28.6%，但同期平均单客收入大幅增长481.4%[4]。如果本地部署业务的需求真如宣传的那样旺盛，客户数量理应随市场扩张而增长，而非出现明显下滑。单客收入的大幅增长，存在两种完全不同的解释：一种是大型企业的中立推理需求本身规模极大，单个客户的订单金额天然很高；另一种则是收入主要来自少数关联方的定向采购，并非市场化的普遍需求。在客户结构数据完全未披露的情况下，两种解释都无法被证实或证伪，但这一反差本身已经足够说明，本地部署业务的增长逻辑远非宣传中那样清晰。

未经验证的核心假设：“Token工厂”的逻辑底座

抛开口径层面的包装，更核心的问题是“Token工厂”这一定位的底层逻辑是否成立。硅基流动的核心叙事是，通过自研的推理引擎与算力调度系统，将不同供应商、不同架构的异构算力资源整合优化，封装成标准化的可计量Token，客户通过统一API即可按需调用，按量付费，就像使用水电一样便捷[2][6]。这一模式成立的核心前提是：自研技术带来的推理效率提升，能够覆盖第三方算力采购的成本溢价。这一核心前提目前无任何公开可验证的技术性能数据支撑。

这一前提的存在有其现实背景：硅基流动自身不持有算力资源，所有算力均需要从第三方采购，相比阿里云、华为云等自有算力的头部厂商，其采购成本天然高出20%至30%[5]。这意味着，如果其自研技术不能将推理吞吐效率提升25%以上，就永远无法在标准化Token业务上实现成本低于头部云厂商，更不可能实现毛利转正。但截至目前，所有公开材料中均未出现任何可验证的技术性能证据：既没有披露自研推理引擎与vLLM、TensorRT-LLM等主流开源框架的端到端吞吐、延迟、显存占用等核心指标的对比数据，也没有第三方测试机构的基准测试结果，甚至没有自行披露的技术优化带来的单位Token降本数据[5][6]。

2025年公有云业务的毛损率从2024年的-271.6%收窄至-119%，常被用作成本优化的证明[5]。但这一改善的核心驱动力是业务规模扩大带来的算力采购议价权提升，而非技术优化带来的内生降本：采购的算力规模越大，拿到的折扣就越高，单位采购成本自然下降。但这种降本方式存在明确的天花板：当采购规模达到一定量级后，供应商的折扣空间会被完全耗尽，后续无法再通过议价进一步降低成本。如果届时技术优化仍未跟上，毛损率的收窄就会停滞，无法达到转正的水平。

更关键的问题在于，硅基流动当前的两大业务线，与“Token工厂”的标准化叙事存在本质冲突。其中，毛利率高达82.5%的本地部署业务，本质是针对客户私有算力架构、合规要求的定制化适配服务，需要为每个客户投入大量人力进行针对性调整[4][5]。客户付费的核心是定制化的技术服务，而非标准化的Token调用。这种模式虽然毛利高，但可复制性极差，客户规模很难快速扩张，2025年本地部署客户数下滑28.6%已经印证了这一点，根本无法支撑“像水电一样大规模供应Token”的公用事业化定位。

而真正符合标准化Token叙事的公有云业务，2025年收入占比已经提升至52.9%，但至今仍处于深度亏损状态[5]。与传统互联网业务的固定成本占比高、规模越大单位成本越低的逻辑不同，硅基流动的核心成本是算力采购的可变成本，每多销售一个Token，就要多支付一份算力的费用，业务规模扩大一倍，亏损规模也会同步扩大一倍，不存在靠规模效应摊薄可变成本的可能。也就是说，如果单位Token的成本不能降到售价以下，业务规模越大，亏损就会越严重，不存在“亏到一定规模就能盈利”的拐点。

很多观点将“中立性”作为独立推理服务商的核心竞争优势，认为企业客户不愿意绑定单一云厂商，愿意为中立的第三方服务支付溢价。但这一逻辑成立的前提是，第三方服务的价格不会比云厂商高出太多。如果没有技术优化带来的成本优势，硅基流动的标准化服务价格永远会比云厂商高20%以上，很难想象企业客户会为了所谓的“不绑定”，长期支付如此高的溢价。没有成本支撑的中立性，本质上是无法商用的伪需求。

资本窗口的博弈：18C身份的适用争议

在商业模式尚未得到验证的情况下，成立不足三年就冲刺IPO，自然引发了关于资本动机的讨论。硅基流动采用的港交所18C上市规则，初衷是为生物科技、半导体等需要长期大额研发投入、短期无法实现商业化的硬科技企业提供融资通道，允许未盈利甚至未产生收入的公司上市。但硅基流动的亏损结构，与18C规则的适用场景存在明显差异。

如前所述，硅基流动的亏损并非来自大额的固定研发投入，而是来自随业务规模线性增长的可变算力成本[5]。也就是说，它的亏损不是研发阶段的阶段性亏损，而是与业务模式绑定的持续性亏损：只要单位Token的成本高于售价，业务做得越大，亏得就越多，不存在研发完成后就能盈利的拐点。这种亏损结构，显然不属于18C规则想要支持的“长期研发投入导致的短期亏损”范畴，确实存在利用规则提前上市、将一级市场的投资风险向二级市场转移的嫌疑。

选择在这个时间点递表，也与当前全球AI领域的资本窗口高度相关。2026年上半年，全球头部AI公司纷纷加快上市进程：Claude开发商Anthropic秘密向美国SEC提交S-1草案，AI芯片公司Cerebras获得20倍超额认购、上调发行价冲刺IPO，国内的快手可灵AI启动Pre-IPO融资、企业级大模型厂商数说故事完成Pre-IPO融资后递表港交所，整个行业都在抢同一个资本热度窗口。对于烧钱速度极快的AI基础设施公司来说，一级市场的融资难度正在上升，趁着市场对AI的热情尚未消退的时候完成上市，是最稳妥的融资选择。

股东背景也为上市动机的讨论增加了变数。硅基流动的股东阵容包括阿里、华为、美团等大型科技公司，这些公司本身既有充足的算力资源，也有大量的AI推理需求[2][3][8]。截至目前，招股书并未披露前五大客户的名单，也没有披露关联交易的占比，因此无法判断占营收近一半的本地部署业务的高收入、高毛利，到底来自市场化的第三方客户，还是来自股东的定向采购。如果股东采购占比过高，那么所谓的“商业化验证”就只是关联交易的结果，不具备可持续性：一旦股东的战略需求得到满足，不再继续采购，这块高毛利的业务就会快速萎缩。

有市场估算称硅基流动当前月均烧钱约1480万元，现有现金储备仅能支撑约一年[5]。虽然这一数据属于二手估算，尚未得到招股书一手数据的验证，但也从侧面反映了行业对其现金流压力的普遍担忧。如果这一估算接近事实，那么冲刺IPO就不仅仅是资本方想要退出的选择，更是公司维持生存的必要融资手段。

判断的边界与可验证的未来

需要明确的是，现有公开信息的局限性，决定了当前所有判断都存在明确的边界，不能直接断定“Token工厂”模式必然失败。目前仍存在几种可能，让硅基流动实现商业化闭环：其一，公司确实持有未公开的技术储备，后续能够拿出第三方可复现的基准测试数据，证明自研推理引擎的性能比主流开源方案高出25%以上，足以覆盖算力采购的成本劣势；其二，股东方能够以远低于市场价的价格向其供应算力，直接抹平采购成本的劣势，当然这属于关联交易带来的优势，而非自身的技术竞争力；其三，头部云厂商出于自身业务定位的考虑，不会重点发展跨模型的中立Token服务，给独立第三方留下足够的市场空间。但这些可能性目前都只是假设，没有任何公开证据支撑。

对于行业观察者和投资者来说，不需要纠结于非黑即白的判断，只需要跟踪几个可验证的核心指标，就能逐步校准对这家公司、乃至整个独立推理服务领域的判断。

第一个是技术维度的指标：如果硅基流动要证明自身的技术竞争力，就必须公开第三方可复现的推理引擎基准测试数据，对比主流开源框架的端到端吞吐、延迟等核心指标。如果性能提升达不到25%，那么公有云业务毛利转正的可能性就极低，“Token工厂”的核心叙事就无法成立。

第二个是财务维度的指标：招股书全文披露后，需要重点核查两个核心数据：一是前五大客户中股东方的采购占比，如果占比超过30%，就说明本地部署的高毛利很大程度上依赖关联交易，市场化程度不足，增长的可持续性存疑；二是销售成本的统计口径，如果其中包含超过30%的预付算力锁仓投入，那么当前的毛损率就包含了为未来扩张做的前置投入，不完全是低价补贴导致的亏损。此外还需要关注公有云付费用户的12个月留存率，如果该指标低于50%，就说明用户粘性很低，当前的增长主要靠低价补贴拉动，无法持续。

第三个是运营维度的指标：未来12个月内，如果公有云业务的毛损率不能收窄到-30%以内，就说明技术降本的速度远远跟不上成本增长的速度，商业化闭环的可能性极低；如果本地部署的客户数量继续下滑，就说明定制化业务的可复制性极差，无法支撑长期的收入增长。

第四个是竞争维度的指标：如果阿里云、华为云等头部云厂商推出同类跨模型统一调用的Token服务，并且凭借自有算力的成本优势下调服务价格，那么硅基流动的生存空间就会被极大挤压，独立第三方的市场定位将面临严峻挑战。

硅基流动的递表，是AI推理基础设施领域的一个标志性样本。它既代表了独立第三方推理服务的探索方向，回应了部分企业对不绑定单一云厂商的需求，也暴露了当前AI领域普遍存在的叙事先行、证据滞后的问题。在核心技术数据、客户结构、成本结构等关键证据补齐之前，所有关于规模化、商业化的判断都只是未经验证的假设。对于整个行业来说，硅基流动的上市进程也将成为一个重要的风向标，无论最终结果如何，都将让市场对AI基础设施领域的价值判断回归到技术和商业的基本逻辑上来。毕竟，任何商业叙事最终都要落到可持续盈利的现实上，资本热度褪去之后，只有真正创造价值的公司才能存活下来。

References

参考资料

Editorial Room

这篇文章怎么过稿

5 位编辑过稿

总编辑主笔

编写方式

总编辑主笔

校稿清单

9/9

资料引用

9 条

编辑席

技术编辑

当前行业对硅基流动递表IPO的讨论多集中在商业策略、资本动机与数据口径层面，却普遍忽略了一个更底层的工程前提：所有“Token工厂”模式成立的假设，都建立在“自研推理与调度优化可覆盖第三方算力采购溢价”的基础上，而这一核心假设至今没有可验证的技术证据支撑，这是我与同行判断最核心的分歧点。首先要承认数据编辑提出的口径修正确实成立，修正此前的部分判断边界：不能将硅基流动2025年整体毛利率转负笼统归因为技术不达标，这一结果本质是公司主动切换收入结构的选择——高毛利的本地部署业务毛利率稳定在82.5%，其收入占比从2024年的85.4%降至2025年的47.1%，是公司主动倾斜资源扩张公有云标准化业务的结果，甚至不排除是为满足港交所18C上市规模要求的刻意操作，这一替代解释的合理性需纳入判断范围。同时校准此前的部分数据置信度：公开估算的“现金储备支撑约12个月”为二手推导值，具体数值需待招股书全文披露后验证；1.5%的市场份额为排除自有云、自有模型服务商的独立细分赛道口径，而非全行业排名，对应市场地位的参考权重需相应下调；其653%的营收增速实际跑输1602%的行业大盘，反而进一步说明当前增长并未体现技术优化带来的差异化竞争力，更多是赛道红利和补贴的共同结果。针对产业编辑提出的“本地部署高毛利已验证中立需求价值”，以及批判编辑提出的“高毛利来自股东定向采购”的质疑，两者其实共同指向同一个技术层面的结论：无论本地部署的客户是股东还是市场化主体，该业务的本质都是针对客户私有算力架构、合规要求的定制化适配项目，客户付费的核心是适配服务而非标准化的推理调度能力，这与“像水电一样按需调用Token”的公用事业化定位存在底层逻辑冲突。哪怕中立性的商业需求真实存在，该业务2025年客户数下滑28.6%的表现，也说明定制化项目的可复制性极差，无法支撑规模化的Token供应叙事。从证据强度来看，当前所有关于技术能力的主张均为招股书的定性描述，既未披露自研推理引擎与vLLM、TensorRT-LLM等主流开源框架的端到端吞吐、延迟、显存占用对比，也没有第三方benchmark验证其异构调度系统的资源利用率，甚至没有自测的技术优化降本数据，这一核心证据的缺失，是所有商业判断都无法绕开的硬约束。按照工程逻辑测算，作为第三方算力聚合方，硅基流动的算力采购成本比自有算力的头部云厂商高20%-30%，除非其推理优化能带来同等幅度的吞吐提升，否则不可能在标准化公有云业务上实现毛利率转正，而这一性能阈值至今没有任何数据证明其已达标或接近达标——这意味着所谓“中立性溢价”目前只是没有成本底座的商业想象，头部云厂商一旦推出跨模型统一调用接口，仅凭自有算力成本优势就能快速挤压其生存空间。结合同行的口径校准和证据补充，修正后的核心技术判断置信度为80%：硅基流动当前的标准化公有云业务增长，与技术优化能力的绑定度远低于与补贴力度的绑定度，其“Token工厂”的核心定位仍属于未经工程验证的商业主张。剩余20%的不确定性来自两方面：一是未公开的技术储备，若后续能拿出第三方可复现的benchmark证明吞吐性能比主流开源方案高25%以上，即可覆盖算力采购的成本劣势；二是股东方是否会提供低于市场价的算力供应，直接抹平其采购成本劣势——但后者属于商业利益输送，而非技术能力带来的核心竞争力。后续可交叉验证的指标需同时覆盖技术、商业、口径三个层面：一是是否公开第三方可复现的推理优化benchmark数据，验证技术降本的实际效果；二是公有云业务毛损率能否在12个月内收窄至-20%以内，排除补贴因素后核算技术优化的贡献占比；三是招股书全文披露的前五大客户中股东方采购占比，以及本地部署客户的年续费率，验证高毛利业务的市场化程度和需求刚性；四是其营收增速能否追上行业平均水平，验证技术能力带来的增长溢价。这一判断并不否认独立推理服务商的赛道探索价值，但任何商业叙事最终都要落地到工程可行性上，在核心技术证据补齐之前，所有关于规模化、商业化的讨论都只是未经验证的假设。

过稿轨迹

挑选题查资料分头看debate碰一下写稿子挑刺gate_reviewrepair_revision改稿子收尾

校稿清单

篇幅是否够讲透有没有反对意见资料够不够宣传腔是否清掉引用是否标清结构是否清楚证据是否撑得住内部讨论是否收住视角是否单薄

被压下去的反对意见

差评君awareness

主张直接定性硅基流动为“资本割韭菜”“模式必然破产”的极端强判断，要求在正文中明确呈现该结论

为什么没放进正文：现有公开信息披露覆盖率仅22%，无足够证据支撑该强结论，不符合“证据温度匹配”原则，相关质疑已转化为后续可验证指标，保留了可反驳空间

Reader Signal

这篇文章对你有帮助吗？

只收集预设选项，不开放评论，不公开展示个人反馈。

选择一个判断，也可以附加一个预设标签。

发布于 2026-07-04 10:18:25。本文为原创深度报告，未经授权不得转载。观点仅代表编辑部独立判断，不构成投资建议。

Model Funding

315亿美元估值背后：AI一级市场的叙事校准与证据缺口

2026-07-04

Model Funding

通用空中智能的叙事边界：硅羽科技半年四轮融资的事实校验

2026-07-02

Model Funding

200亿估值迷局：具身智能的资本热与未被验证的商用边界

2026-07-02

Model Funding

智平方50亿融资背后：具身智能的估值叙事与商业化边界

2026-06-30

被定制的口径：亮眼指标的边界陷阱

未经验证的核心假设：“Token工厂”的逻辑底座

资本窗口的博弈：18C身份的适用争议

判断的边界与可验证的未来

参考资料

这篇文章对你有帮助吗？

相关阅读

315亿美元估值背后：AI一级市场的叙事校准与证据缺口

通用空中智能的叙事边界：硅羽科技半年四轮融资的事实校验

200亿估值迷局：具身智能的资本热与未被验证的商用边界

智平方50亿融资背后：具身智能的估值叙事与商业化边界