See key specs and per-benchmark scores for each model/mode. Scroll horizontally for all columns. 当前对比 2 个模型的评测数据与核心参数。
从基准测试数据来看,Claude Mythos Preview 在几乎所有核心能力维度都处于领先地位,差距在编程类评测上尤为悬殊。以最受行业关注的 SWE-bench Verified 为例,Mythos Preview 得分 93.9%,而 Claude Opus 4.7 为 87.6%;在难度更高的 SWE-bench Pro 上,两者差距扩大至 13.5 个百分点(77.8% vs 64.3%)。Terminal-Bench 2.0 上 Mythos 同样以 82.0% 对 65.4%(Opus 4.6 基准)的成绩大幅领先,反映出其在长时间自主代码任务中已达到接近顶尖人类工程师的操作水平。
科学推理与数学方面,Mythos Preview 在 GPQA Diamond 上得分 94.5%,在 Humanity's Last Exam 无工具条件下得分 56.8%,在 USAMO 数学奥林匹克测试上接近满分(97.6%)。这些数字表明 Mythos 不仅是编码上的代际跃升,也是通用推理能力的全方位突破。
值得注意的是,Opus 4.7 并非停滞不前。相较于 Opus 4.6,Opus 4.7 在 SWE-bench Pro 上从 53.4% 提升至 64.3%,CursorBench 从 58% 升至 70%,且在知识综合类评测(GDPVal-AA)上以 Elo 1753 分领先 GPT-5.4 和 Gemini 3.1 Pro。这说明 Opus 4.7 已是目前可公开调用模型中的实际第一梯队。
Opus 4.7 在视觉处理上实现了大幅升级:支持最高 3.75MP(2,576 像素长边)的图像输入,视觉导航精度达 98.5%,是 Opus 4.6(1.15MP,精度 54.5%)的三倍以上分辨率提升。这一改动直接提升了 Opus 4.7 在文档分析、设计稿理解、计算机使用等企业场景下的实用价值。
Mythos Preview 则在 SWE-bench Multimodal(需结合视觉上下文解决编程问题)上得分 59.0%,是 Opus 4.6(27.1%)的两倍有余。但这一评测针对的是"视觉与代码协同推理"这一更专项的能力维度,与 Opus 4.7 侧重的通用视觉识别有所区分。两者的多模态优势并不完全重叠。
将 Claude Opus 4.7 与 Mythos Preview 直接做商用价值对比,需要首先厘清一个关键前提:Mythos Preview 目前不对外开放。Anthropic 通过 Project Glasswing 将其限制在 Apple、Google、Microsoft 等 12 家组织内部使用,服务方向集中于关键基础设施的网络安全防御任务。即便将来对外开放,其定价(输入 $25 / 1M tokens,输出 $125 / 1M tokens)也是 Opus 4.7($5 输入 / $25 输出)的 5 倍,并且最大输出长度仅为 8,192 tokens,远低于 Opus 4.7 的 65,536 tokens。
这意味着对绝大多数开发者和企业而言,Claude Opus 4.7 才是当前实际可选的最强模型,而 Mythos Preview 代表的是 Anthropic 尚未商业化的能力天花板,更多具有基准参照价值,而非直接竞品关系。
从评测数据来看,Claude Mythos Preview 在编程自主性、数学推理与科学理解上均处于全球已知模型的最高水平,其 SWE-bench Verified 93.9% 与 Humanity's Last Exam 56.8% 代表了当前 AI 能力的实际边界。Claude Opus 4.7 则在这一边界之下尽可能缩小差距:视觉能力大幅升级、编程性能超越同期所有公开模型、企业级长上下文处理表现稳健。
对实际用户而言,选择的问题并不存在:Mythos Preview 暂不可用,Opus 4.7 是当下最强可调用选项,且在编程、视觉与知识综合类任务上已与 GPT-5.4、Gemini 3.1 Pro 形成明确性能优势。Mythos Preview 的存在,更多提示了 Opus 系列未来一至两代的能力演进方向。
Claude Opus 4.7
Claude Mythos Preview
Compare benchmark results across thinking modes and tool usage.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
Best Overall
—
Best Single
—
Thinking Mode (Default)
Claude Opus 4.7 · 1 Modality support
Higher is usually better; “—” means no score.
Complete scores for each model/mode across selected benchmarks.
Feature compare
Licensing, MoE architecture, and multi-modality support.
| Features & specs | CL Claude Opus 4.7Anthropic | CL Claude Mythos PreviewAnthropic |
|---|---|---|
Model snapshots | ||
Organization | Anthropic | Anthropic |
模型全名 | Claude Opus 4.7 | Claude Mythos Preview |
模型简介 | Not provided | Not provided |
模型类型 | 推理大模型 | 聊天大模型 |
模型代号 | claude-opus-4-7 | claude-mythos-preview |
Release | 2026-04-16 | 2026-04-07 |
MoE | No | No |
规格与性能 | ||
Context length | 1000K | — |
Parameters | — | — |
激活参数量 | Not provided | Not provided |
模型规模 | 未知 | 未知 |
模型大小 | Not provided | Not provided |
推理速度 | ||
推理等级 | ||
最大输出 | 131072 | 8192 |
Supported modes | No mode data | No mode data |
开源与许可 | ||
Code Open Source | Not provided | Not provided |
Weights Open Source | Not provided | Not provided |
Commercial use | 不开源 | 不开源 |
Modality support | ||
Text Input/Output | / | / |
Image Input/Output | Not provided | Not provided |
Audio Input/Output | Not provided | Not provided |
Video Input/Output | Not provided | Not provided |
Embedding Input/Output | Not provided | Not provided |
API 接口详情 | ||
Text 价格 | Input: $5 / 1M tokensOutput: $25 / 1M tokensCache: $6.25 / 1M tokens | Input: $25 / 1M tokensOutput: $125 / 1M tokens |
Image API pricing | Not provided | Not provided |
Audio API pricing | Not provided | Not provided |
Video API pricing | Not provided | Not provided |
Embedding API pricing | Not provided | Not provided |
Resources | ||
GitHub | Not provided | Not provided |
Hugging Face | Not provided | Not provided |
Official Page | Not provided | Not provided |
Guides | Not provided | Not provided |
Papers | Introducing Claude Opus 4.7 | Introducing Claude Mythos Preview and Project Glasswing |
DataLearnerAI | Anthropic发布Claude Opus 4.7:编程能力大幅跃升,视觉分辨率提升超3倍,首个搭载网络安全防护机制的旗舰模型! | Claude Mythos 是什么?Anthropic最强模型评测、安全能力与Project Glasswing详解 |
API pricing
Side-by-side input/output token pricing