洗个脚,还能捅出多大篓子?Dario:我不这么认为。
Anthropic 自己把还没端上桌的硬菜给掀出来了。
事情起因很简单:Anthropic 的 CMS 管理系统配置出了低级错误,默认设置成了公开,结果接近三千个内部资产直接裸奔在外网。里面有还没发布的博客草稿、结构化网页、各种没打算给外人看的文件。最要命的一份,是介绍新一代模型的草稿,名字挺玄乎,叫Claude Mythos。
Mythos 意为神话,光听名字就感觉这次的模型不简单。
就在泄露前不久,Dario Amodei 带着少数受邀的欧洲科技公司CEO们,在英国一座18世纪城堡改建的水疗中心开了闭门峰会。


不过,当提到Capybara(水豚)的时候,我第一时间想到的是 Qwen 系列的吉祥物卡皮巴拉?

而 Mythos(神话)就是这个新层级的第一款产品。
你可以理解为,Anthropic 在给未来的产品线重新分层,顺便暗示后面还有得玩。

泄露的草稿写得就没那么收敛了。
里面提到,在软件编程、学术推理、网络安全这些测试里,Mythos的成绩“显著更高”。

进步最大的点在网络安全,说这个模型在漏洞利用能力上已经超过了目前所有AI,有可能带来一波AI驱动的攻击浪潮。
这句话放在草稿里还好,一旦被外界看到,味道就完全变了。
Anthropic的应对也挺有意思。他们没有急着说“大家别慌”,而是强调发布会会非常谨慎,只给少数早期客户测试,而且优先提供给网络安全防御人员。逻辑很清楚,这玩意如果真这么猛,先让守门的人用起来,再考虑放出去。

这其实是个挺微妙的信号。
过去几年,大模型的能力提升大多集中在写代码更快、写文章更像人、推理更顺滑等,,但逐渐开始,网安这个领域被放到台面上讨论,语气用词也越发直接,从“可能有风险”变成了“会不会被大规模利用”。

这次泄露风波还有个细节。
一场原本只邀请欧洲CEO的闭门峰会,一个老庄园,Dario Amodei 大讲特讲未发布的能力。
你会发现,这些公司在对外和对内的沟通,已经是两套节奏。
对外是谨慎、克制、强调安全。
对内或者特定圈子,是更直接的能力展示。

问题就在这儿。
当模型能力开始触及安全边界的时候,谁先用、怎么用、什么时候公开,都会变成策略问题,而不是单纯的产品节奏。Anthropic 这次“先给防御者”的说法,很可能会被后面一批公司模仿,甚至变成一种默认操作。
但这也带来另一个问题。
如果只有一部分人先拿到更强的工具,那不对称本身也会放大。

这次事件本身其实没泄露什么最核心的东西。
模型更多信息没有流出,具体参数也没有,甚至连基准分数都没见着,只是一篇没发的博客。但它把一个原本还在“内部叙事”的东西,突然丢进了公共讨论里。
大家第一次比较具体地看到,这一代模型在某些能力上,已经开始让开发者自己都觉得需要“踩刹车”。
你可以把这当成一次小事故,也可以当成一个信号。
AI的进展还在继续,但它带来的问题,已经不只是“好不好用”,而是“谁先用”“怎么控”。
而这类问题,显然不会只出现一次。
