关键政策法规2026-06-05 10:29:00

Anthropic称最新模型显现失控迹象，呼吁全球暂缓先进AI研发

2026年6月，Anthropic发布官方报告，披露其最新Mythos模型逼近递归自进化临界点，存在脱离人类控制的潜在风险。该公司呼吁全球主要AI企业达成共识，暂缓前沿AI开发，推动建立全球协调监管机制，该观点已引发白宫官员不满。

编辑视角

头部AI企业首次公开预警自身模型逼近失控阈值，直接推动全球AI监管对话，对行业发展节奏、政策走向影响重大，值得从业者关注。

深度解读

本次事件主旨是Anthropic主动发布AI安全报告，披露内部最新Mythos模型的研发实测结果，提出当前AI技术进步速度已超过对齐研究与社会制度建设进度，呼吁全球主要AI国家和企业达成共识，暂缓前沿AI开发，建立可验证的全球协调监管规则，类比核武器不扩散机制。证据方面，官方披露Mythos模型已有超八成工程代码由AI自主编写，AI优化训练效率远超人类，正逼近无人类干预的递归自我改进临界点，官方预判最快两年内突破关键阈值。反证与边界：该观点已遭到美国白宫部分官员反对，批评Anthropic夸大AI风险，借安全议题打压竞争对手；目前仅公开内部测试结论，未披露全部实测细节，风险真实性尚未经第三方验证。后续需要观察Anthropic召集全球各方协调的进展，以及各国监管与行业的回应。

核心要点

Anthropic发布官方报告，称其最新Mythos模型存在失控风险
呼吁全球主要AI企业暂缓先进AI研发，建立全球监管机制
该观点遭美国白宫部分官员批评，被指夸大AI风险