重磅!Anthropic官方数据泄露,正在测试新的大模型Claude Mythos,规模超越Opus,能力实现“阶梯式”飞跃!
几个小时前,Anthropic发生一起信息泄露事件,还没来得及官宣,自家最强新模型就被"意外"公之于众。

事情的起因,是一位安全研究员在公开可访问的数据缓存里,发现了 Anthropic 尚未发布的博客草稿。这份文件详细描述了一个叫做 Claude Mythos(也叫 Capybara)的新模型——据称是 Anthropic 有史以来最强大的 AI,且在网络安全方向上拥有"前所未有"的能力。当前这些信息主要来自Fortune的报道,但是Anthropic承认了有相关的信息。
一、Anthropic新模型信息泄露背景情况
Anthropic 用来管理官网博客的内容管理系统(CMS),有一个默认行为:所有上传的文件,默认就是公开的,除非用户主动修改权限设置。
结果某位员工在操作过程中忘了改这个设置,导致将近 3000 份内部文件——包括博客草稿、图片、PDF,甚至一份员工育儿假文件——都被公开"晒"在了互联网上。
这就相当于,你把公司内部会议室的白板拍了照,然后不小心把照片发到了公司官网。
发现这件事的,是两位安全研究员:LayerX Security 的资深 AI 安全研究员 Roy Paz,以及剑桥大学的网络安全研究员 Alexandre Pauwels。
Fortune 的记者联系了 Anthropic,Anthropic 承认是"人为操作失误",并在被通知后迅速关闭了公开访问入口。所以,这件事和泄露的内容都是真实的、经过核实的。
值得注意的是,泄露的并不是一段内部 Slack 消息或者 PPT,而是一篇带有标题、发布日期、完整页面结构的博客草稿——说明发布准备已经推进到了内容层面,离官宣可能并不遥远。
二、泄露信息表明Anthropic已经训练出比Opus强大很多的模型
简单总结一下,虽然有 3000 多份文件泄露,但是比较核心的信息大概有三点:
第一,新模型叫 Capybara,比 Opus 还要强一级。
目前,Anthropic 的模型按能力从强到弱分为三档:Opus、Sonnet、Haiku。而这次泄露的文件显示,Capybara 将是一个全新的、比 Opus 更强的档位。
草稿里这样描述:「Capybara 是一个新的模型层级:比我们迄今最强的 Opus 系列更大、更智能——但同时也更贵。」

第二,它的另一个名字叫 Claude Mythos,是迄今最强的模型。
文件里说,Anthropic 已经完成了对 Claude Mythos 的训练,将其描述为**「我们有史以来开发过的、迄今为止最强大的 AI 模型」**。但从泄露的信息来看,Mythos 和 Capybara 的关系目前还不完全清晰——Fortune 原文用的措辞是"似乎指向同一个底层模型",也有观点认为两者是同一系列里的不同版本(一个是 v1,一个是 v2)。目前没有定论,官方也没有进一步解释。
**第三,它在网络安全方面的能力,强到让 Anthropic 自己都感到担忧。**以至于官方虽然训练出来模型,但是目前并不确定如何发布。
顺带一提,"Capybara"这个命名本身也值得关注。 Anthropic 现有的命名体系——Haiku、Sonnet、Opus——都是文学或音乐相关的词,风格统一。而水豚(Capybara)是一种动物,完全打破了这个惯例。这种刻意的断裂,暗示 Anthropic 想用命名本身传达一个信号:这不是 Opus 的下一代,而是另一个层级的东西,不在原来的序列里。
三、Claude Mythos在网络安全方面的破坏力非常强!
根据泄露的文件,Mythos 在网络安全能力方面「目前远超任何其他 AI 模型」,而且 Anthropic 认为,它的存在「预示着即将到来的一波 AI 模型浪潮,这些模型能够以远超防御方的速度发现和利用漏洞」。
换句话说:这个模型,可能比现有的任何黑客工具都要厉害。一旦发布,当前世界上的软硬件系统可能面临非常大的威胁。
OpenAI 在今年 2 月发布 GPT-5.3-Codex 时,也首次将其标记为网络安全「高危能力」模型——这是 OpenAI 历史上的第一次。Anthropic 之前的 Opus 4.6 同期发布,也因能在真实代码库中发现未知漏洞而被特别提示。
草稿里具体提到,Capybara 在软件编程、学术推理、网络安全这三个方向上的评测成绩均「显著高于」Opus 4.6——其中网络安全方向的领先幅度尤为突出,被单独点名强调。
四、Claude Mythos目前在小范围特定人群中测试
正因为上面这些顾虑,Anthropic 并没有打算直接公开发布 Mythos。
根据草稿里描述的发布策略:
- 首先只向早期访问合作企业开放,重点面向网络安全防御方
- 这些机构可以用它来提前加固自己的代码库,在「AI 驱动的攻击浪潮」到来之前做好准备
- 模型目前运行成本较高,尚不适合大规模公开使用
Anthropic 在回应 Fortune 的采访时也确认:「我们将这个模型视为一次『阶跃式进化』,是我们迄今构建的最强大的模型。」
这意味着,它不只是又一次常规更新,而是 Anthropic 认为在能力上发生了质的跨越。
另外值得关注的是,这次的发布策略本身也是前所未有的。以往所有大模型发布,都是先向开发者和普通用户开放,安全问题往往是事后处理。而这次 Anthropic 打算反过来——先给网络安全防御机构,让他们提前加固系统,再考虑更广泛的发布。这背后其实是一种相当直白的承认:这个模型对攻击方的潜在价值,可能大于对普通用户的价值。
五、顺便一提:还有一个"高管峰会"的秘密
泄露的文件里,还有一份意外曝光的 PDF:Anthropic CEO Dario Amodei 即将出席一场仅限受邀的欧洲企业 CEO 闭门峰会,地点在英国一座 18 世纪的庄园酒店。
参会者被描述为「欧洲最具影响力的商界领袖」,议程包括与政策制定者的圆桌讨论,以及体验尚未公开发布的 Claude 新功能。
这场活动本来应该秘密进行的。
结语:这次泄露,说明了什么?
目前,Opus 4.6 应该是毫无争议最贵也是最强的模型,特别是在编程、推理、网络漏洞发现等方面都非常强大,GPT-5.3-Codex 虽然评价不错,但在前端方面显著落后于 Claude Opus 4.6,而其他方面则很多人都有对比,总体上 Opus 4.6 的评价似乎更好一点。
而尚未发布但已经训练完成的 Claude Mythos 既然已经被 Anthropic 认为是比 Opus 更强的模型,且是「阶跃式进化」,实在是让人很期待。虽然这家企业口碑真的不是那么好,对国内也不太感冒,但大模型方面目前的确非常可以,在企业市场,OpenAI 显著属于一个追赶者。
根据此前很多人讨论和分析,Claude 模型好很可能是坚持 Dense 架构且不断扩大模型规模和训练数据规模,所以他们的模型很贵,也很好。而如果按照这个逻辑猜测,Claude Mythos 也许是这个基础上规模更大的模型。
