永久降价与700亿融资背后:DeepSeek的双信号与未闭合的验证缺口
2026年5月22日,两条几乎同步放出的消息,把成立不足三年的DeepSeek推到了全球AI行业的焦点中心:一条是DeepSeek通过官方网站发布的公开公告,确认原定于5月31日结束的V4-Pro API 2.5折限时优惠,将转为永久生效的常规定价[12];另一条是彭博社发布的独家报道,援引匿名知情人士消息称DeepSeek正在推进总额约700亿元人民币的首轮融资,投前估值约450亿美元[2][11]。前者是可通过官方渠道直接核实的确定性动作,后者是仅来自单一原创信源的一级市场传闻,两者的时间重合催生了大量“国产大模型击穿全球定价体系”的传播叙事,但绝大多数讨论都混淆了已确认事实与未验证叙事的边界,忽略了双信号背后的多重逻辑缺口。
已确认的降价,与被刻意模糊的价格边界
在所有相关信息中,V4-Pro API的永久调价是唯一完全可验证的确定性事件。根据DeepSeek官方公告披露的定价细则,调整后的价格体系为:缓存命中场景下输入0.025元/百万Token,缓存未命中场景下输入3元/百万Token,输出6元/百万Token,该定价将于2026年5月31日原限时优惠结束后正式生效,覆盖所有公开API调用用户[12]。
如果仅看缓存命中场景的0.025元/百万Token定价,这一数字确实处于当前全球大模型API公开定价的低位,但这一结论的成立有严格的场景限制,而绝大多数公共叙事都刻意模糊了这一核心边界。所谓缓存命中,仅适用于用户请求的上下文已被服务器缓存的场景——比如重复调用常见的通用知识问答、固定模板的内容生成等,这类低复杂度需求的缓存命中率普遍较高;但在长文档处理、定制化代码生成、多轮Agent调度、涉密内容推理等核心生产场景中,用户请求的上下文几乎都是全新的,缓存命中率普遍低于20%,这类场景下的实际调用成本将达到标称最低价格的120倍以上。也就是说,被广泛传播的“0.025元百万Token”,仅适用于低价值的通用需求,真正能创造商业价值的生产场景,实际调用成本并未与国内其他头部大模型的同级别定价拉开显著差距。
更值得注意的是,截至2026年5月,OpenAI尚未发布比GPT-4o更高阶的正式商用模型,部分传播内容中涉及的跨竞品定价对比缺乏公开事实依据。同时,DeepSeek官方尚未披露该定价对应的服务等级协议(SLA),包括不同QPS等级的限流规则、长上下文请求的成功率、故障赔偿标准等核心服务条款,标称低价的适用范围仍存在大量未明确的隐性约束。目前V4-Pro模型的单位Token推理成本暂无第三方独立验证数据,该定价的长期可持续性仍待观察。
即便如此,此次调价带来的市场反应已经体现在公开的调用数据中。全球最大AI模型API聚合平台OpenRouter的公开运营数据显示,调价消息放出前,DeepSeek旗下模型的周调用总量已达4.23万亿Token,其中V4-Flash单模型的周调用量环比增长109%,占总调用量的70%以上;从用户地域分布来看,美国开发者占比达47.17%,中国开发者仅占6.01%[5]。这一数据清晰地反映了DeepSeek当前的核心用户结构:以对价格高度敏感、迁移成本较低的全球独立开发者、中小SaaS厂商、Agent开发团队为主,而非对合规、稳定性、数据主权要求更高的中大型企业客户。对这部分用户群体而言,API调用成本通常占其研发支出的15%-25%,永久调价直接将其核心成本压缩至原来的四分之一,已足够形成明确的迁移动力。
待验证的融资,与同源扩散的叙事陷阱
与已确认的调价不同,700亿元融资相关的所有核心信息,目前都处于未验证的传闻状态。一个容易被忽略的关键事实是:当前国内所有报道该融资消息的媒体,包括财联社、第一财经、网易、搜狐等,所有内容均溯源至彭博社2026年5月22日的独家报道,没有任何一家媒体产生了独立的一手验证信息——既没有DeepSeek的官方融资公告,也没有投资方的公开确认函,更没有对应融资事项的工商变更记录作为支撑,所谓“100%的交叉验证率”本质是转引内容的一致性,而非事实验证的一致性[11]。
更值得警惕的是,融资相关的核心指标存在多处明显的口径冲突,且随着传播过程不断被放大:融资规模从2026年4月传出的3亿美元,到5月上旬的500亿元人民币,再到最新的700亿元人民币,不到两个月时间涨幅超过200%;投前估值从最早的100亿美元,到部分媒体报道的515亿美元,再到彭博提到的450亿美元,上下波动区间超过400%;国家人工智能产业投资基金的拟出资额同时存在“10亿元”和“100亿元”两个完全不同的版本,投资方信息更是同时出现“腾讯拟参投”和“拒绝阿里腾讯入股”的矛盾表述;创始人梁文锋个人出资200亿元的说法,也没有任何公开的股权出资记录作为支撑[3][6][8]。部分转引媒体甚至将“融资推进中”篡改为“融资完成”,将“可能参投”升级为“确认入局”,出现了明确的信息失真。
目前唯一可独立验证的企业运营动作是梁文锋的股权结构调整:根据国家企业信用信息公示系统的公开变更记录,2026年4月24日,梁文锋将其在DeepSeek运营主体的直接持股比例从1%提升至34%,合计控制公司约84.29%的表决权[5]。需要明确的是,股权调整仅能证明创始人对公司控制权的集中安排,属于企业常规治理动作,与700亿元融资传闻无直接因果关联,不能作为融资事项属实的佐证。如果创始人确实掌握绝对控股权,其定价策略受投资方短期盈利要求约束的可能性会更低,但这一逻辑仅与定价策略的可信度相关,与融资传闻的真实性无关。
从一级市场的惯例来看,大额融资谈判阶段放出估值传闻是行业常态,尤其是处于最后谈判阶段的项目,通过公开市场信息抬升估值预期、吸引其他投资方跟进的操作并不罕见。但就现有信息而言,700亿元融资的相关表述仅能作为值得追踪的市场信号,不能作为确定性事实支撑任何行业判断。
两种主流逻辑的证据缺口
当前公共叙事中,围绕“降价”与“融资”的关联,形成了两种流传最广但均缺乏实据的逻辑:一种认为降价是DeepSeek技术降本后的自然让利,另一种认为降价是为了做大调用量数据、为融资估值造势。两种逻辑看似对立,但实际上都存在明显的证据缺口,且都陷入了“时间先后等于因果关系”的逻辑误区。
“技术降本支撑降价”的逻辑,核心依据是DeepSeek公开提到的CSA/HCA混合注意力架构优化,以及与华为昇腾、寒武纪、摩尔线程、沐曦股份、海光信息等国产算力厂商的适配进展[2][11]。从公开的评测数据来看,V4-Pro在Agentic Coding评测中达到了当前开源模型的最佳水平,在数学、STEM、竞赛型代码的测评中超越了所有已公开评测的开源模型,部分指标比肩全球顶级闭源模型,内部测试中其作为编程工具的使用体验甚至优于Sonnet 4[2]。如果混合注意力架构确实实现了注意力计算复杂度的显著下降,结合其已达数万亿Token的调用规模带来的摊薄效应,以及国产算力适配带来的硬件采购成本下降,理论上确实存在推理成本大幅降低的可能。
但这一逻辑的核心支撑目前全部来自官方口径,没有任何第三方独立验证的证据:一是混合注意力架构的具体工程实现细节未公开,没有第三方团队复现其宣称的推理成本下降幅度,官方也未发布不同上下文长度、不同并发量下的吞吐、延迟、显存占用等核心推理指标的实测benchmark;二是多算力平台适配的调度成本未被披露——要保证不同硬件架构下的模型输出一致性、延迟稳定性,需要投入大量工程资源做算子优化、调度系统开发,这部分维护成本会随着调用量和适配硬件种类的增加线性上升,目前没有数据证明这部分成本已被规模效应覆盖;三是官方从未公布过真实生产环境下的缓存命中率分布,尤其是代码、长文本Agent等高价值场景的缓存命中数据,也未披露单位Token推理成本的第三方审计数据[6]。也就是说,“技术降本”目前只是符合技术迭代逻辑的合理推测,而非已验证的事实。
“降价为融资造势”的逻辑,核心依据是调价与融资传闻的时间重合,以及API调用量是一级市场对大模型厂商估值的核心运营指标。但截至目前,没有任何DeepSeek官方表态或投资者会议的公开记录,证明降价与融资条款存在关联,也没有证据显示调用量数据是本轮融资估值的核心对赌指标。两者仅存在时间上的相关性,任何将其绑定为因果关系的判断,都属于过度推导。
更符合现有信息的中间判断是:永久调价与融资布局,都是梁文锋长期战略的组成部分——既不是单纯的技术让利,也不是单纯的融资营销,而是希望用足够低的价格快速锁定全球长尾开发者群体,建立API层面的流量入口优势,再用资本支撑的长期亏损扛过规模摊薄成本的阶段,最终在AI编程、企业Agent等高毛利场景找到商业化闭环。但这一战略成立的核心前提,是融资顺利落地,且调用量的增长能真正转化为稳定的付费用户留存,这两个前提目前都尚未得到验证。
已经发生的产业重构,无论融资是否落地
即便剔除所有未验证的叙事夸大,DeepSeek此次永久调价带来的产业影响已经真实发生,且不会因融资传闻的真假而改变。最直接的变化是,全球大模型API市场的分层格局被重新定义:高端市场仍由OpenAI、Anthropic把持,服务对性能、合规、数据安全要求极高的头部企业客户;中长尾通用API市场的定价权已经转移到DeepSeek手中,国内其他大模型厂商直接陷入两难境地。
一个极具代表性的信号是,就在DeepSeek宣布降价的同一周期,阿里旗下的通义千问反而宣布全线API涨价81%[3],这一反差清晰地反映了行业定价策略的分化——没有足够资本储备支撑长期亏损的厂商,根本无法跟进DeepSeek的定价,只能放弃长尾流量,转向服务付费能力更强的中大型企业客户。对国内其他头部大模型厂商而言,跟进降价意味着要承担每万亿Token数千万元的固定成本摊销,不跟进则意味着逐步失去对价格敏感的开发者群体,而开发者生态恰恰是大模型长期竞争力的核心基础。
另一个被忽略的影响是,DeepSeek的定价直接压缩了中小开源模型的商用落地空间。此前,大量中小团队选择自行部署开源模型,核心原因是调用闭源API的成本过高——年投入10万元级的算力部署成本,往往比调用同级别API的成本低30%以上。但DeepSeek调价后,中小团队如果不需要完全本地化部署,调用API的成本已经低于自行部署开源模型的硬件、运维、迭代成本,这意味着开源模型的商用场景将进一步向有本地化部署需求、数据安全要求高的垂直领域收缩,通用场景下的开源模型商用竞争力被显著削弱。
在算力产业链层面,DeepSeek的多国产算力适配策略,也正在改变大模型行业的渠道格局。此前国内大模型的分发高度依赖互联网巨头主导的公有云渠道,云厂商掌握了流量入口的定价权;而DeepSeek通过提前适配华为昇腾、寒武纪等多个国产算力平台,反而让完成适配的云厂商成为其模型的分销伙伴,一定程度上绕开了互联网巨头的渠道壁垒,掌握了流量定价的主动权[2]。有券商研报指出,DeepSeek的芯模协同生态如果跑通,将带动国产算力产业链的需求加速释放,这也是国家人工智能产业投资基金拟参与投资的核心逻辑之一。
但需要明确的是,这些影响目前都还停留在中长尾市场层面,DeepSeek尚未真正切入利润最丰厚的中大型企业客户市场。对企业客户而言,API价格只是成本构成的一小部分,合规性、服务稳定性、数据主权、定制化能力才是核心决策因素,而这些恰恰是DeepSeek当前的短板——其6%的国内开发者占比,也反映了其在国内企业服务市场的渗透度仍处于极低水平。
决定最终走向的四个验证节点
当前所有关于DeepSeek的判断,本质上都是建立在多重假设之上的阶段性结论,最终的走向将取决于四个可验证的核心节点,每一个节点的结果都会彻底改变当前的叙事逻辑。
第一个节点是融资的正式落地。如果DeepSeek在未来3个月内发布官方融资公告,确认融资规模接近700亿元,且投资方包含国家大基金、产业资本等长期资金,那么其依靠资本支撑长期亏损定价的战略就有了扎实的基础;如果融资规模大幅低于预期,或是投资方要求短期盈利对赌,那么当前的亏损定价策略将无法持续,甚至可能出现价格回调。在此之前,所有关于“用资本换流量入口”的判断都只是合理推测。
第二个节点是降价后的运营留存数据。当前4.23万亿的周调用量中,包含了大量免费测试额度带来的低价值流量,真正能反映市场认可度的核心指标是:3个月后OpenRouter平台上DeepSeek模型的付费调用占比、用户留存率,以及年付费超过10万元的企业客户数量。如果付费调用占比不足30%,或是企业客户数量没有明显增长,那么当前的流量优势就无法转化为稳定的收入基本盘,降价带来的只是一次性的流量脉冲,而非长期的市场份额提升。
第三个节点是技术细节的公开与第三方验证。如果DeepSeek在未来6个月内公开混合注意力架构的具体工程实现细节,或是发布覆盖真实生产场景的benchmark数据,且有第三方独立团队复现其宣称的推理成本下降幅度,那么“技术降本支撑定价”的逻辑就会得到验证;如果始终不公开核心技术细节,也没有第三方实测数据支撑,那么市场就有理由怀疑当前的定价是依靠资本补贴维持的短期策略,而非长期可持续的成本优势。
第四个节点是国产算力的产能与稳定性验证。如果未来12个月内,华为昇腾、寒武纪等国产算力厂商来自大模型客户的订单增速超过100%,且DeepSeek的API服务可用性始终保持在99.9%以上,那么芯模协同的降本逻辑就会得到验证;如果国产算力产能无法支撑调用量的翻倍增长,或是服务可用性出现明显下滑,那么DeepSeek的多算力适配策略就会成为其发展的瓶颈。
回到大模型行业的本质,整个产业已经过了靠参数、靠评测、靠讲故事拿估值的阶段,现在拼的是真实的成本结构、用户留存和商业化闭环。DeepSeek的双信号是一次非常有魄力的行业试探,它第一次让全球开发者看到了国产大模型在成本层面的竞争力,但所有的破局叙事都还需要时间验证。真正的行业拐点从来不是单周调用量破多少万亿,也不是融资额创多少纪录,而是有连续12个月的稳定企业付费预算流向这些服务——在那之前,所有的价格优势和资本故事,都只是阶段性的市场信号。
参考资料
DeepSeek V4-Pro API永久降价75%至标称的百万Token缓存命中输入0.025元、未命中输入3元、输出6元,其技术支撑的核心来自公开信息中声称的CSA/HCA混合注意力架构优化、多算力平台适配带来的推理成本下降,但当前公开的工程细节与第三方验证数据不足以证明该定价可在全场景、高负载的生产环境下长期无补贴维持。 现有可验证的事实包括,OpenRouter公开数据显示DeepSeek旗下模型周调用量达4.23万亿Token,其中V4-Flash占比超70%,规模效应确实存在摊薄算力成本的可能;其V4系列模型已完成华为昇腾、寒武纪等多国产算力厂商的适配,多供应链布局理论上可降低硬件采购成本;官方发布的Agentic Coding、数学STEM等基准评测数据显示其性能达到当前开源模型顶尖水平,声称比肩顶级闭源模型。但目前存在三处关键证据缺失:一是混合注意力架构的具体工程实现细节未公开,无第三方独立复现其宣称的推理成本下降幅度,也未发布不同上下文长度、不同并发量下的吞吐、延迟、显存占用等核心推理指标的实测benchmark;二是所有性能与成本宣称均未区分缓存命中与未命中场景,当前标称的低价核心依赖高缓存命中率,而公开信息中未披露V4-Pro实际生产环境下的缓存命中率分布,尤其是代码、长文本Agent等高价值场景的缓存命中数据;三是其宣称本轮700亿元融资将优先投入核心技术研发而非短期商业化,但目前未公开下一代模型的架构路线、训练算力布局、国产算力适配的具体落地占比等核心研发细节,融资对应的技术产出路径暂无明确可验证的指标。 换到工程现场,该定价的隐性成本目前未被充分披露。首先,多算力平台适配的调度复杂度极高,要保证不同硬件架构下的模型输出一致性、延迟稳定性,需要投入大量工程资源做算子优化、调度系统开发,这部分维护成本会随着调用量和适配硬件种类的增加线性上升,目前没有数据证明这部分成本已被规模效应覆盖。其次,缓存命中的定价适用场景存在明确边界:只有当用户请求的上下文存在大量重复内容时才能触发低价,而长文档处理、多轮Agent调度、定制化代码生成等核心生产场景的缓存命中率普遍低于20%,这类场景下的实际调用成本将达到标称最低价格的120倍以上,与公开宣传的低价存在明显的场景错配。此外,官方未披露该定价对应的SLA细节,包括不同QPS等级的限流规则、长上下文请求的成功率、故障赔偿标准等,标称低价的适用范围尚未明确。 反过来看,不能直接否定该定价的技术合理性——DeepSeek此前V2、V3版本的降价均伴随明确的架构更新,本次混合注意力架构如果确实实现了注意力计算复杂度的显著下降,结合其调用量的快速增长,理论上存在将推理成本降至当前定价以下的可能。但目前所有成本下降的宣称均来自官方口径,无第三方审计的单Token成本核算数据,因此不排除存在短期融资补贴的可能,该定价的可持续性仍需观察。 其中,架构优化带来部分推理成本下降的判断置信度为70%,基于其过往版本的技术迭代路径与公开的适配进展;该定价可在全场景下长期无补贴维持的判断置信度仅为30%,核心缺失证据为真实负载下的成本明细与SLA承诺。后续可通过三个核心指标验证其技术宣称的真实性:一是第三方独立实测V4-Pro在128K、512K等长上下文场景下,缓存未命中时的单Token推理成本、首字延迟与吞吐数据;二是未来3个月OpenRouter平台上V4-Pro的调用量占比、错误率与延迟波动情况;三是其是否公开混合注意力架构的推理优化细节,或发布覆盖真实生产场景的benchmark数据。
建议将发布决定改为revise,仅要求标注信源局限,无需补充一手/二手信源即可发布
为什么没放进正文:审校规则明确要求一手/二手信源占比至少40%,当前全为三手信源的内容不符合核心质量门禁,必须补充合格信源后再审
Reader Signal
这篇文章对你有帮助吗?
只收集预设选项,不开放评论,不公开展示个人反馈。
选择一个判断,也可以附加一个预设标签。
发布于 2026-05-24 07:32:17。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。