美国政府已要求 Anthropic 立即停止两款高性能模型的访问权限,分别是 Claude Fable 5 和 Claude Mythos 5。Anthropic 表示已执行命令,但认为政府这次判断失当,且措施范围远超原本针对外国公民的出口管制目标。
这项指令据称于美国东部时间周五下午 5 点 21 分送达。按照 Anthropic 的说法,公司被要求在全球范围关闭这两款模型,而不是仅限制特定对象使用。其余 Claude 模型暂未受影响。
Mythos此前一直受限开放
Mythos 5 是 Anthropic 能力最强的模型之一。公司今年 4 月初首次对外预览后,并未全面开放,而是长期维持严格限制。Anthropic 当时给出的理由是,这款模型在发现软件安全漏洞方面能力过强。
公司称,Mythos 在测试中找出了多个主流操作系统和浏览器的漏洞,因此只通过名为 Project Glasswing 的受控项目向约 50 家经过审核的机构开放,主要用于防御性网络安全工作。参与方包括 Amazon、Apple、Google、Microsoft 和 CrowdStrike。
Fable 5 发布仅三天即被叫停
Fable 5 则是 Anthropic 面向更广泛市场推出的版本。它在 Mythos 的基础上加入了额外限制,重点封锁网络安全和生物等高风险领域的回答。Anthropic 认为,这使其可以面向公众发布。
按 Vals AI 的基准测试,Fable 5 发布后很快成为公开可用模型中能力最强的一批产品之一。但这款模型上线仅三天,就遭遇政府叫停。
Anthropic 表示,政府此次行动名义上属于出口管制,但公司理解,真正触发措施的原因是一种针对 Fable 5 的所谓“越狱”方式。公司称,政府目前只提供了口头说明,所指问题是一种范围较窄、并不普遍适用的绕过方式,其效果主要是让模型阅读特定代码库并识别软件缺陷。
公司称行业标准可能被抬高
Anthropic 进一步表示,这类能力并非其独有,其他公开模型也已具备类似水平,包括 OpenAI 的 GPT-5.5。公司还称,网络安全从业者本就会将这类能力用于防御用途。
Anthropic 同时强调,其关键安全防护并不只依赖模型本身,还包括独立运行的分类器系统。即便用户通过提示词让模型继续输出,底层针对高风险内容的拦截机制仍会生效。公司称,近期使用记录中没有发现这些防护被成功绕过并生成真正有害内容的证据。
不过,政府仍然决定采取行动。Anthropic 公开表示,不认同因为一种范围有限的潜在越狱方式,就撤回一款已面向数亿用户部署的商业模型。公司还警告,如果这一标准被普遍采用,前沿模型提供商的新模型发布可能都会受到明显影响。
这一事件也让 Anthropic 一直强调的“安全优先”路线面临更复杂的现实考验。公司此前反复强调 Mythos 风险较高,因此未向公众开放;如今,这种高调的安全表述反而可能加大了监管关注,并直接冲击其产品发布节奏与业务安排。