TL;DR — 美国政府以国安为由强制下架 Anthropic 的 Fable 5 与 Mythos 5,但所谓「越狱」只是叫模型读程序代码找漏洞,一件资安工程师每天都在做的事。当监管者听不见产业在跳的那段音乐,再正常的动作看起来都像发疯。

「听不见音乐的人,认为那些跳舞的人疯了。」
这是我在青岛良友书坊看到的诗本笔记本的句子。拍的时候觉得很有道理,这句子就一直停在我脑中。
6 月 13 日早上,我打开电脑想接着跑测试,结果 Fable 打不开,其他模型用起来也很卡。查了才知道,前一天 6 月 12 日,美国政府用「国家安全」当理由,要求 Anthropic 停用两款最新的模型,Fable 5 和 Mythos 5。一夜之间,全球用户全都用不了。
美国政府到底下令停用了什么?
先把事实讲清楚,因为这件事很容易被传成「美国禁了 Anthropic 的 AI」。
根据 Anthropic 的官方声明,这是一道「出口管制令」(export control directive),援引国安权限,要求禁止「任何外籍人士」存取 Fable 5 与 Mythos 5,不分人在不在美国境内,连 Anthropic 自己的外籍员工都算在内。实务上要做到这种程度的合规,唯一的办法就是对全体用户直接关掉这两款。声明里也特别用粗体强调:其他所有 Anthropic 模型不受影响。
所以,这不是一般意义上的「封杀一家公司」。值得警惕的是,政府不只是监管企业,而是直接把手伸向前沿模型本身,并以国安与出口管制为名,要求它暂时退出公共使用场域。
Anthropic 表示,他们是在美东时间当天下午 5 点 21 分收到这封信;而信中并未清楚说明,所谓的国安疑虑究竟指向哪一项具体风险。

那个「越狱」有多严重?Anthropic 怎么说
「越狱」这个词本身很有力量。它让人立刻想到黑客、攻击、入侵、失控,好像这两个字出现,后面的细节都不再重要。治理最危险的地方,往往就在于语言先行定罪,而理解还没有跟上。
Anthropic 在声明中说:到目前为止,政府所提出的口头证据,只是要求模型阅读一份特定 codebase,找出其中的软件瑕疵,并协助修补。如果把这件事放回资安工作现场,它并不神秘,也不罕见。也是许多工程师每天都在做的事。
Anthropic 的回应大致是三层意思。第一,Anthropic 表示,他们重新检视该示范后,发现模型找到的只是先前已知且影响有限的漏洞。更重要的是,这些漏洞并不是 Fable 5 或 Mythos 5 的独特危险能力,其他公开可用的模型同样能做到,包括 OpenAI 的 GPT-5.5。换句话说,问题不是某个模型突然越过了红线,而在于监管者可能把整个产业已经具备的基础能力,误读成一种特殊威胁。第二,阅读程序代码、找出漏洞、协助修补,这在资安领域并不是攻击者的专利,而是守方的基本日课。问题不是模型会不会看见漏洞,而是它被放在什么治理框架、什么使用情境、在什么责任边界内使用。第三,Fable 上市前已经跟美国政府、英国 AISI 以及多个第三方机构一起,对它的防护做了总计数千小时的红队测试,结果显示它的防护强度高于业界任何已部署的模型,到目前为止没有任何测试者找到「通用越狱」。
📊 关键数据
- 下架时间:2026 年 6 月 12 日下午 5:21(美东时间)收到禁令
- 影响范围:Fable 5、Mythos 5 两款,其他模型不受影响
- 「越狱」内容:叫模型读程序代码找出并修补漏洞
- 上市前测试:与政府、英国 AISI、第三方红队测试共数千小时
- 通用越狱:至今 0 例被找到
也就是说,在懂这个产业的人耳中,这段音乐并不陌生。那个被放大成国安威胁的动作,其实是资安防御每天都在进行的基本舞步。问题是,当一个治理者听不懂这段音乐,他看到的就是一群人正在做出难以理解的动作。
为什么这不是 Anthropic 一家的事?
Anthropic 的态度很清楚:它没有选择对抗法律,而是先行合规;但它也没有把合规等同于认同。
他们点出了一个比「两款模型能不能用」更大的隐忧。Anthropic 认为,一个「狭义、非通用」的潜在越狱,不该成为召回一个已经服务数亿人的商业模型的理由。如果这套标准真的拿来套用到整个产业,那基本上以后没有任何一款前沿模型能上市。因为任何够强的模型,都做得到「读程序代码找漏洞」这件事。
这里要分辨的是:这到底是一种缺陷,还是一种能力?如果一个模型能阅读程序代码、理解结构、找出漏洞,就被视为不可接受的风险,那么被定罪的就不再是某个具体行为,而是智能本身。这是我认为最麻烦的地方。
Anthropic 也呼应了他们先前在「Policy on the AI Exponential」里讲过的立场:政府当然应该有权力挡下不安全的部署,但前提是要走一套「透明、公平、清楚、立基于技术事实」的法定程序。而这次的行动,并不符合这些原则。这是整件事最关键的一句,比「我们被下架了」严重得多。这也是为什么我把这篇放进 文明与人性 这个系列:它表面上是 AI 新闻,骨子里是关于人怎么面对自己不理解的东西。
一个 builder 的现场:我花了一百多美元,然后它消失了
讲点我自己的部分。
Fable 被停用之前,我正为了跑一轮测试在烧额度。看了 Extra 账单,两天花了一百五十几美元。对一个自己掏钱验证工具的人来说,亲自动手做,才能对一款模型「能做什么」有具体的感觉。理解工具,不能只看别人怎么说,要放进自己的问题、流程与限制里,看看它能完成多少任务。

正因如此,当它一夜之间消失时,我的反应不是震惊于新闻,而是工作卡住,专案跑一半,工具没了。这是监管不确定性真实的样子。不是纸上的政策辩论,而是会直接干扰正在发生的生产流程。
然后我想到账单,心情有点微妙。一百多美金,现在看来也算值得:至少在它消失前,我已经操过一轮,知道它的手感。这大概就是这个时代给 builder 的荒谬感:工具快速进化,制度却尚未理解它。我们一边追赶技术,一边承受它随时可能被关上的风险。所以,能用的时候就尽量用透,能理解的时候就尽量理解,留下自己的判断与体感。这也证明,我们确实身处知识与制度交界的前沿。
听不见音乐的人,会怎么看跳舞的人?
这件事让我不安的,不是模型被下架。模型可以恢复,沟通可以继续,Anthropic 也说了他们认为这是一场误会,正在积极争取恢复。
令我不安的,是理解的鸿沟在加深。当治理者不理解产业,他所看见的,就是一群难以控制,正在逼近危险边界的人。对身在其中的人而言,那不是失控,而是新的工作秩序正在生成。
在这个越来越复杂的 2026 年,理解彼此本愈来愈难。但我不想把这件事简化成「技术人懂,监管者不懂」。那样太容易,也太傲慢。更深一层来看,我们每个人都可能在某些领域里成为那个听不见音乐的人。面对我们陌生的领域与世界,很容易把别人的节奏看成混乱,把能力看成威胁,把自己尚未理解的东西看成不该存在。能不能先停下那个「他疯了」的直觉,承认自己也许只是还没听见,这需要的不是知识,而是一种谦卑。
所以,跳舞的人未必疯了。
很多时候,只是旁观的人还没有听见那段音乐。
而一个真正成熟的治理时代,不能只急着叫人停止跳舞;它必须先学会辨认,那段音乐到底从哪里来,又将把我们带往哪里。
常见问题
Q:美国政府下架的是 Anthropic 全部的 AI 模型吗? 不是。这次只针对 Fable 5 与 Mythos 5。官方声明明确写其他所有模型不受影响。但因为禁令要求「禁止任何外籍人士存取」,Anthropic 为了合规,只能对全体用户停用这两款。
Q:政府说的「越狱」到底有多危险? 根据 Anthropic,政府给的口头证据本质上就是「叫模型读程序代码、找出并修补漏洞」。这些漏洞已知且轻微,其他公开模型不必越狱也找得到,而且这是资安工程师每天的防御工作。
Q:Anthropic 照办了吗? 照办了,已对全体用户停用,但公开表达不同意,认为这套标准若推及全产业,会让所有前沿模型无法上市。他们认为这是误会,正在争取恢复。
Q:为什么这件事值得关注? 因为它是 AI 监管与前沿模型的第一次正面对撞。它牵动的是整个产业未来的监管框架,不只是两款模型能不能用。
💬 留言讨论
加载中...