自动展示选中模型的核心信息与各评测得分,可左右滑动查看完整表格。 当前对比 2 个模型的评测数据与核心参数。
从基准测试数据来看,Claude Mythos Preview 在几乎所有核心能力维度都处于领先地位,差距在编程类评测上尤为悬殊。以最受行业关注的 SWE-bench Verified 为例,Mythos Preview 得分 93.9%,而 Claude Opus 4.7 为 87.6%;在难度更高的 SWE-bench Pro 上,两者差距扩大至 13.5 个百分点(77.8% vs 64.3%)。Terminal-Bench 2.0 上 Mythos 同样以 82.0% 对 65.4%(Opus 4.6 基准)的成绩大幅领先,反映出其在长时间自主代码任务中已达到接近顶尖人类工程师的操作水平。
科学推理与数学方面,Mythos Preview 在 GPQA Diamond 上得分 94.5%,在 Humanity's Last Exam 无工具条件下得分 56.8%,在 USAMO 数学奥林匹克测试上接近满分(97.6%)。这些数字表明 Mythos 不仅是编码上的代际跃升,也是通用推理能力的全方位突破。
值得注意的是,Opus 4.7 并非停滞不前。相较于 Opus 4.6,Opus 4.7 在 SWE-bench Pro 上从 53.4% 提升至 64.3%,CursorBench 从 58% 升至 70%,且在知识综合类评测(GDPVal-AA)上以 Elo 1753 分领先 GPT-5.4 和 Gemini 3.1 Pro。这说明 Opus 4.7 已是目前可公开调用模型中的实际第一梯队。
Opus 4.7 在视觉处理上实现了大幅升级:支持最高 3.75MP(2,576 像素长边)的图像输入,视觉导航精度达 98.5%,是 Opus 4.6(1.15MP,精度 54.5%)的三倍以上分辨率提升。这一改动直接提升了 Opus 4.7 在文档分析、设计稿理解、计算机使用等企业场景下的实用价值。
Mythos Preview 则在 SWE-bench Multimodal(需结合视觉上下文解决编程问题)上得分 59.0%,是 Opus 4.6(27.1%)的两倍有余。但这一评测针对的是"视觉与代码协同推理"这一更专项的能力维度,与 Opus 4.7 侧重的通用视觉识别有所区分。两者的多模态优势并不完全重叠。
将 Claude Opus 4.7 与 Mythos Preview 直接做商用价值对比,需要首先厘清一个关键前提:Mythos Preview 目前不对外开放。Anthropic 通过 Project Glasswing 将其限制在 Apple、Google、Microsoft 等 12 家组织内部使用,服务方向集中于关键基础设施的网络安全防御任务。即便将来对外开放,其定价(输入 $25 / 1M tokens,输出 $125 / 1M tokens)也是 Opus 4.7($5 输入 / $25 输出)的 5 倍,并且最大输出长度仅为 8,192 tokens,远低于 Opus 4.7 的 65,536 tokens。
这意味着对绝大多数开发者和企业而言,Claude Opus 4.7 才是当前实际可选的最强模型,而 Mythos Preview 代表的是 Anthropic 尚未商业化的能力天花板,更多具有基准参照价值,而非直接竞品关系。
从评测数据来看,Claude Mythos Preview 在编程自主性、数学推理与科学理解上均处于全球已知模型的最高水平,其 SWE-bench Verified 93.9% 与 Humanity's Last Exam 56.8% 代表了当前 AI 能力的实际边界。Claude Opus 4.7 则在这一边界之下尽可能缩小差距:视觉能力大幅升级、编程性能超越同期所有公开模型、企业级长上下文处理表现稳健。
对实际用户而言,选择的问题并不存在:Mythos Preview 暂不可用,Opus 4.7 是当下最强可调用选项,且在编程、视觉与知识综合类任务上已与 GPT-5.4、Gemini 3.1 Pro 形成明确性能优势。Mythos Preview 的存在,更多提示了 Opus 系列未来一至两代的能力演进方向。
Best Overall
—
Best Single
—
Thinking 模式(默认)
Opus 4.7 · 1 模态支持
模型数据收集自官网、Artificial Analysis等页面
完整列出各模型/模式的评测得分,便于横向比较。
其他能力
是否 MoE、商业授权、模态支持等附加能力对比。
| 功能与规格 | OP Opus 4.7Anthropic | CL Claude Mythos PreviewAnthropic |
|---|---|---|
模型信息卡片 | ||
开发机构 | Anthropic | Anthropic |
模型全名 | Claude Opus 4.7 | Claude Mythos Preview |
模型简介 | 未提供 | 未提供 |
模型类型 | 推理大模型 | 聊天大模型 |
模型代号 | claude-opus-4-7 | claude-mythos-preview |
发布时间 | 2026-04-16 | 2026-04-07 |
MoE 架构 | 不支持 | 不支持 |
规格与性能 | ||
上下文 | 1000K | — |
参数量 | — | — |
激活参数量 | 未提供 | 未提供 |
模型规模 | 未知 | 未知 |
模型大小 | 未提供 | 未提供 |
推理速度 | ||
推理等级 | ||
最大输出 | 131072 | 8192 |
支持模式 | 暂无模式数据 | 暂无模式数据 |
开源与许可 | ||
代码开源 | 未提供 | 未提供 |
权重开源 | 未提供 | 未提供 |
商业授权 | 不开源 | 不开源 |
模态支持 | ||
文本 输入/输出 | / | / |
图片 输入/输出 | 未提供 | 未提供 |
音频 输入/输出 | 未提供 | 未提供 |
视频 输入/输出 | 未提供 | 未提供 |
Embedding 输入/输出 | 未提供 | 未提供 |
API 接口详情 | ||
文本 价格 | 输入: $5 / 1M tokens输出: $25 / 1M tokensCache: $6.25 / 1M tokens | 输入: $25 / 1M tokens输出: $125 / 1M tokens |
图片 API 价格 | 未提供 | 未提供 |
音频 API 价格 | 未提供 | 未提供 |
视频 API 价格 | 未提供 | 未提供 |
Embedding API 价格 | 未提供 | 未提供 |
资源与链接 | ||
GitHub | 未提供 | 未提供 |
Hugging Face | 未提供 | 未提供 |
官方页面 | 未提供 | 未提供 |
实用指南 | 未提供 | 未提供 |
论文/报告 | Introducing Claude Opus 4.7 | Introducing Claude Mythos Preview and Project Glasswing |
DataLearnerAI | Anthropic发布Claude Opus 4.7:编程能力大幅跃升,视觉分辨率提升超3倍,首个搭载网络安全防护机制的旗舰模型! | Claude Mythos 是什么?Anthropic最强模型评测、安全能力与Project Glasswing详解 |
API 价格
输入输出 token 价格并排展示