加载中...

重磅！Anthropic官方数据泄露，正在测试新的大模型Claude Mythos，规模超越Opus，能力实现“阶梯式”飞跃！

2026/03/27 14:02:32

119 views

几个小时前，Anthropic发生一起信息泄露事件，还没来得及官宣，自家最强新模型就被"意外"公之于众。

事情的起因，是一位安全研究员在公开可访问的数据缓存里，发现了 Anthropic 尚未发布的博客草稿。这份文件详细描述了一个叫做 Claude Mythos（也叫 Capybara）的新模型——据称是 Anthropic 有史以来最强大的 AI，且在网络安全方向上拥有"前所未有"的能力。当前这些信息主要来自Fortune的报道，但是Anthropic承认了有相关的信息。

一、Anthropic新模型信息泄露背景情况

Anthropic 用来管理官网博客的内容管理系统（CMS），有一个默认行为：所有上传的文件，默认就是公开的，除非用户主动修改权限设置。

结果某位员工在操作过程中忘了改这个设置，导致将近 3000 份内部文件——包括博客草稿、图片、PDF，甚至一份员工育儿假文件——都被公开"晒"在了互联网上。

这就相当于，你把公司内部会议室的白板拍了照，然后不小心把照片发到了公司官网。

发现这件事的，是两位安全研究员：LayerX Security 的资深 AI 安全研究员 Roy Paz，以及剑桥大学的网络安全研究员 Alexandre Pauwels。

Fortune 的记者联系了 Anthropic，Anthropic 承认是"人为操作失误"，并在被通知后迅速关闭了公开访问入口。所以，这件事和泄露的内容都是真实的、经过核实的。

值得注意的是，泄露的并不是一段内部 Slack 消息或者 PPT，而是一篇带有标题、发布日期、完整页面结构的博客草稿——说明发布准备已经推进到了内容层面，离官宣可能并不遥远。

二、泄露信息表明Anthropic已经训练出比Opus强大很多的模型

简单总结一下，虽然有 3000 多份文件泄露，但是比较核心的信息大概有三点：

第一，新模型叫 Capybara，比 Opus 还要强一级。

目前，Anthropic 的模型按能力从强到弱分为三档：Opus、Sonnet、Haiku。而这次泄露的文件显示，Capybara 将是一个全新的、比 Opus 更强的档位。

草稿里这样描述：「Capybara 是一个新的模型层级：比我们迄今最强的 Opus 系列更大、更智能——但同时也更贵。」

Opus 4.6模型在网址设计方面远超GPT-5.4

第二，它的另一个名字叫 Claude Mythos，是迄今最强的模型。

文件里说，Anthropic 已经完成了对 Claude Mythos 的训练，将其描述为**「我们有史以来开发过的、迄今为止最强大的 AI 模型」**。但从泄露的信息来看，Mythos 和 Capybara 的关系目前还不完全清晰——Fortune 原文用的措辞是"似乎指向同一个底层模型"，也有观点认为两者是同一系列里的不同版本（一个是 v1，一个是 v2）。目前没有定论，官方也没有进一步解释。

**第三，它在网络安全方面的能力，强到让 Anthropic 自己都感到担忧。**以至于官方虽然训练出来模型，但是目前并不确定如何发布。

顺带一提，"Capybara"这个命名本身也值得关注。 Anthropic 现有的命名体系——Haiku、Sonnet、Opus——都是文学或音乐相关的词，风格统一。而水豚（Capybara）是一种动物，完全打破了这个惯例。这种刻意的断裂，暗示 Anthropic 想用命名本身传达一个信号：这不是 Opus 的下一代，而是另一个层级的东西，不在原来的序列里。

三、Claude Mythos在网络安全方面的破坏力非常强！

根据泄露的文件，Mythos 在网络安全能力方面「目前远超任何其他 AI 模型」，而且 Anthropic 认为，它的存在「预示着即将到来的一波 AI 模型浪潮，这些模型能够以远超防御方的速度发现和利用漏洞」。

换句话说：这个模型，可能比现有的任何黑客工具都要厉害。一旦发布，当前世界上的软硬件系统可能面临非常大的威胁。

OpenAI 在今年 2 月发布 GPT-5.3-Codex 时，也首次将其标记为网络安全「高危能力」模型——这是 OpenAI 历史上的第一次。Anthropic 之前的 Opus 4.6 同期发布，也因能在真实代码库中发现未知漏洞而被特别提示。

草稿里具体提到，Capybara 在软件编程、学术推理、网络安全这三个方向上的评测成绩均「显著高于」Opus 4.6——其中网络安全方向的领先幅度尤为突出，被单独点名强调。

四、Claude Mythos目前在小范围特定人群中测试

正因为上面这些顾虑，Anthropic 并没有打算直接公开发布 Mythos。

根据草稿里描述的发布策略：

首先只向早期访问合作企业开放，重点面向网络安全防御方
这些机构可以用它来提前加固自己的代码库，在「AI 驱动的攻击浪潮」到来之前做好准备
模型目前运行成本较高，尚不适合大规模公开使用

Anthropic 在回应 Fortune 的采访时也确认：「我们将这个模型视为一次『阶跃式进化』，是我们迄今构建的最强大的模型。」

这意味着，它不只是又一次常规更新，而是 Anthropic 认为在能力上发生了质的跨越。

另外值得关注的是，这次的发布策略本身也是前所未有的。以往所有大模型发布，都是先向开发者和普通用户开放，安全问题往往是事后处理。而这次 Anthropic 打算反过来——先给网络安全防御机构，让他们提前加固系统，再考虑更广泛的发布。这背后其实是一种相当直白的承认：这个模型对攻击方的潜在价值，可能大于对普通用户的价值。

五、顺便一提：还有一个"高管峰会"的秘密

泄露的文件里，还有一份意外曝光的 PDF：Anthropic CEO Dario Amodei 即将出席一场仅限受邀的欧洲企业 CEO 闭门峰会，地点在英国一座 18 世纪的庄园酒店。

参会者被描述为「欧洲最具影响力的商界领袖」，议程包括与政策制定者的圆桌讨论，以及体验尚未公开发布的 Claude 新功能。

这场活动本来应该秘密进行的。

结语：这次泄露，说明了什么？

目前，Opus 4.6 应该是毫无争议最贵也是最强的模型，特别是在编程、推理、网络漏洞发现等方面都非常强大，GPT-5.3-Codex 虽然评价不错，但在前端方面显著落后于 Claude Opus 4.6，而其他方面则很多人都有对比，总体上 Opus 4.6 的评价似乎更好一点。

而尚未发布但已经训练完成的 Claude Mythos 既然已经被 Anthropic 认为是比 Opus 更强的模型，且是「阶跃式进化」，实在是让人很期待。虽然这家企业口碑真的不是那么好，对国内也不太感冒，但大模型方面目前的确非常可以，在企业市场，OpenAI 显著属于一个追赶者。

根据此前很多人讨论和分析，Claude 模型好很可能是坚持 Dense 架构且不断扩大模型规模和训练数据规模，所以他们的模型很贵，也很好。而如果按照这个逻辑猜测，Claude Mythos 也许是这个基础上规模更大的模型。

DataLearner WeChat

Follow DataLearner WeChat for the latest AI updates

Back to Blog List