Claude 5.0？只是洗了个脚，就泄露了

洗个脚，还能捅出多大篓子？Dario：我不这么认为。

Anthropic 自己把还没端上桌的硬菜给掀出来了。

事情起因很简单：Anthropic 的 CMS 管理系统配置出了低级错误，默认设置成了公开，结果接近三千个内部资产直接裸奔在外网。里面有还没发布的博客草稿、结构化网页、各种没打算给外人看的文件。最要命的一份，是介绍新一代模型的草稿，名字挺玄乎，叫Claude Mythos。

Mythos 意为神话，光听名字就感觉这次的模型不简单。

就在泄露前不久，Dario Amodei 带着少数受邀的欧洲科技公司CEO们，在英国一座18世纪城堡改建的水疗中心开了闭门峰会。

不过，当提到Capybara（水豚）的时候，我第一时间想到的是 Qwen 系列的吉祥物卡皮巴拉？

而 Mythos（神话）就是这个新层级的第一款产品。

你可以理解为，Anthropic 在给未来的产品线重新分层，顺便暗示后面还有得玩。

泄露的草稿写得就没那么收敛了。

里面提到，在软件编程、学术推理、网络安全这些测试里，Mythos的成绩“显著更高”。

进步最大的点在网络安全，说这个模型在漏洞利用能力上已经超过了目前所有AI，有可能带来一波AI驱动的攻击浪潮。

这句话放在草稿里还好，一旦被外界看到，味道就完全变了。

Anthropic的应对也挺有意思。他们没有急着说“大家别慌”，而是强调发布会会非常谨慎，只给少数早期客户测试，而且优先提供给网络安全防御人员。逻辑很清楚，这玩意如果真这么猛，先让守门的人用起来，再考虑放出去。

这其实是个挺微妙的信号。

过去几年，大模型的能力提升大多集中在写代码更快、写文章更像人、推理更顺滑等，，但逐渐开始，网安这个领域被放到台面上讨论，语气用词也越发直接，从“可能有风险”变成了“会不会被大规模利用”。

这次泄露风波还有个细节。

一场原本只邀请欧洲CEO的闭门峰会，一个老庄园，Dario Amodei 大讲特讲未发布的能力。

你会发现，这些公司在对外和对内的沟通，已经是两套节奏。

对外是谨慎、克制、强调安全。

对内或者特定圈子，是更直接的能力展示。

问题就在这儿。

当模型能力开始触及安全边界的时候，谁先用、怎么用、什么时候公开，都会变成策略问题，而不是单纯的产品节奏。Anthropic 这次“先给防御者”的说法，很可能会被后面一批公司模仿，甚至变成一种默认操作。

但这也带来另一个问题。

如果只有一部分人先拿到更强的工具，那不对称本身也会放大。

这次事件本身其实没泄露什么最核心的东西。

模型更多信息没有流出，具体参数也没有，甚至连基准分数都没见着，只是一篇没发的博客。但它把一个原本还在“内部叙事”的东西，突然丢进了公共讨论里。

大家第一次比较具体地看到，这一代模型在某些能力上，已经开始让开发者自己都觉得需要“踩刹车”。

你可以把这当成一次小事故，也可以当成一个信号。

AI的进展还在继续，但它带来的问题，已经不只是“好不好用”，而是“谁先用”“怎么控”。

而这类问题，显然不会只出现一次。

原文链接：https://www.he6.net/2099.html，转载请注明出处。

社交账号快速登录