美国副总统万斯召集 OpenAI、Anthropic、谷歌等科技公司 CEO,专门讨论单一 AI 模型的安全风险——这件事本身比 Mythos 模型的实际能力更具信号意义。[1][2] 白宫对 Anthropic 旗下 Mythos 模型“自主挖掘软件漏洞”表达警惕,认为其可能攻击乡镇银行、医院和供水设施,且地方政府无力应对。[2] 将该事件定性为“打乱白宫人工智能战略”的叙事存在过度推演,但万斯的担忧指向一个真实的结构性问题:当 AI 系统开始触及关键基础设施的软件漏洞时,防御责任的归属出现了空白。
万斯的表态有据可查。据报道,他与一众 CEO 通话时直言“我们各方必须就此展开协作”,参会者名单囊括了 OpenAI 的山姆·奥尔特曼、Anthropic 的达里奥·阿莫代伊、SpaceX 的埃隆·马斯克和谷歌高管。[2] 将这种级别的会议视为一次常规 AI 安全协调,会低估议题升级的速度;一个模型的单一能力被联邦副总统拿出来点名讨论,意味着安全关切的类型正在从“通用风险”转向“特定能力对特定基础设施的可攻击性”。乡镇银行、医院和供水设施这三个被点名的对象不是随机举例——它们构成关键基础设施中防御最薄弱的环节,预算有限、补丁周期长,且缺乏网络安全专业团队。万斯担心的本质不是 Mythos 已经发动攻击,而是这类能力一旦扩散,责任链条尚不存在。
需要保留的边界是:Mythos 自主挖掘软件漏洞的能力目前缺乏公开可验证的证据。没有公开论文,没有代码,也没有第三方复现的 benchmark。自主漏洞挖掘在学术界有长期积累,从 DARPA 的网络大挑战到各类 CTF 自动化研究,但端到端实现“识别—利用—武器化”链条的可靠性,并降到足以定向攻击真实基础设施的误报率,现有公开系统都远未达到。即便能力成立,部署成本、安全控制的复杂度以及误攻击风险尚未被量化讨论。所有报道均依赖匿名人士转述,没有提供任何样本攻击案例或地方政府无力应对的具体实证。[1][2][3][4] 风险叙事建立在形容词而非可复现实验之上。如果后续出现技术白皮书或独立审计报告推翻了这一判断,当前的担忧才会获得工程事实的支撑。
但这不意味着事件不产生后果。万斯的点名已将防御责任的归属问题推到了博弈的核心。联邦层面的安全关切将迫使责任从“模型提供方是否做了足够的安全控制”延伸至“关键基础设施运营者是否具备对抗此类能力的防御手段”——而这恰恰是地方政府明确缺乏的。目前执法和追责机制空缺,万斯呼吁“协作”而非“监管”,表明行政分支仍在寻求行业自律方案,未到达立法或行政命令阶段。更谨慎的读法是:这次通话可能加速 AI 模型的安全评估与部署许可流程,但短期不会改变市场准入规则。
Anthropic 在事件中的位置值得关注。被副总统在全行业会议上点名,客观上为该公司在网络安全市场的定位完成了一次“威胁认定”背书,这可能在短期内抬高其议价权,但也将它的安全控制机制置于更广的监管审视之下——Mythos 的自主能力是否超出了当前的审计范围,是需要回答的问题。从产业逻辑看,真正的商业化拐点不取决于白宫是否担忧,而取决于接下来两个季度是否出现政府资助的防御性部署合同,以及是否有银行或医院真正将此类模型嵌入安全审核流程。目前还没有客户续费或扩容的证据,买单方要从“政治关注”迁移到“预算分配”,中间还差一道合规指令。
因此,主线是:Mythos 事件暴露了 AI 对关键基础设施攻击的防御责任空白,但其攻击能力本身尚未被证实。如果这个判断要被推翻,需要三类事实出现——Mythos 模型权重或能力接口向独立审计开放;第三方在真实基础设施环境中复现其漏洞挖掘链并公布发现率与误报率;存在实际攻击或防御部署的工程记录而非政治通话内容。在此之前,“打乱白宫战略”的主体是政策层的焦虑,而非技术层的事实闭环。
参考资料
Mythos模型声称的“自主挖掘软件漏洞”能力目前缺乏任何可验证实现——无论文、无代码、无第三方复现的benchmark。万斯的担忧建立在Anthropic内部演示或单向声称上,而非公开可复现的工程闭环。自主漏洞挖掘在学术圈已有多年探索(如DARPA CGC挑战),但达到能定向攻击乡镇银行、医院供水设施的自动化程度,涉及漏洞发现链(识别→利用→武器化)的端到端可靠性与低误报率,现有任何公开系统都远未达到。更关键的是,即便能力成立,其部署成本(算力、训练数据、安全控制的复杂度)与可控性风险(误攻击、模型越狱)尚未量化。技术编辑的判断是:目前这更像一则政策叙事,技术叙事需要先回答“模型权重是否公开?漏洞挖掘的发现率与误报率是多少?能否被第三方独立复现?”在这一切缺失前,“打乱战略”的主体是政治信号而非技术事实。
主结论将单次通话解读为防御逻辑重构过于确定,实际政策变动未发生,标题加剧此倾向。
为什么没放进正文:总编辑认为正文已用“改变了博弈结构”支撑标题,且“重构”一词能传递事件的政策转折信号,微调会削弱冲击力。
Reader Signal
这篇文章对你有帮助吗?
只收集预设选项,不开放评论,不公开展示个人反馈。
选择一个判断,也可以附加一个预设标签。
发布于 2026-05-08 14:07:42。本文为原创深度报告,未经授权不得转载。观点仅代表编辑部独立判断,不构成投资建议。