Opus 4.7vsOpus 4.1

在 4 个共同 benchmark 中,Opus 4.7 整体领先:Opus 4.7 领先 4 项,Opus 4.1 领先 0 项,持平 0 项,平均分差 +20.72。

Anthropic
Opus 4.7

Anthropic · 2026-04-16 · 推理大模型

Anthropic
Opus 4.1

Anthropic · 2025-08-06 · 推理大模型

Opus 4.74 (100%)(0%)0 Opus 4.1

评测分数

按能力类目分组,每组内按分差大小排列;共 4 项。

Math and Reasoning

Opus 4.7 领先 2/2
评测项Opus 4.7Opus 4.1分差
FrontierMath43.806 / 60极高强度思考(无工具)5.9035 / 60Normal (No Tools)+37.90
FrontierMath - Tier 422.9012 / 80极高强度思考(无工具)4.2040 / 80Thinking (No Tools, 32K Budget)+18.70

Coding and Software Engineer

Opus 4.7 领先 1/1
评测项Opus 4.7Opus 4.1分差
SWE-bench Verified87.605 / 108Extended (with tools)74.5036 / 108Extended (with tools)+13.10

General Knowledge

Opus 4.7 领先 1/1
评测项Opus 4.7Opus 4.1分差
GPQA Diamond94.204 / 178Extended (no tools)8169 / 178Extended (no tools)+13.20

规格对比

字段Opus 4.7Opus 4.1
发布机构AnthropicAnthropic
发布时间2026-04-162025-08-06
模型类型推理大模型推理大模型
架构稠密模型稠密模型
参数规模暂无数据暂无数据
上下文长度1000K200K
最大输出128K32K

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项Opus 4.7Opus 4.1
文本输入$5 / 1M tokens$15 / 1M tokens
文本输出$25 / 1M tokens$75 / 1M tokens
缓存读取$0.5 / 1M tokens$1.5 / 1M tokens
缓存写入$6.25 / 1M tokens$18.75 / 1M tokens

小结

  • Opus 4.7在以下类目领先:Math and Reasoning (2/2)、Coding and Software Engineer (1/1)、General Knowledge (1/1)

4 个共同 benchmark 上,Opus 4.7 平均高出 20.72 分。

单项差距最大的 benchmark:FrontierMath — Opus 4.7 43.80,Opus 4.1 5.90(分差 +37.90)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。