Claude Opus 4.8vsOpus 4.7

在 4 个共同 benchmark 中，Claude Opus 4.8 整体领先：Claude Opus 4.8 领先 4 项，Opus 4.7 领先 0 项，持平 0 项，平均分差 +3.63。

Anthropic · 2026-05-28 · 推理大模型

Anthropic · 2026-04-16 · 推理大模型

Claude Opus 4.84 项(100%)(0%)0 项Opus 4.7

评测分数

按能力类目分组，每组内按分差大小排列；共 4 项。

Claude Opus 4.8 领先 2/2

评测项	Claude Opus 4.8	Opus 4.7	分差
SWE-Bench Pro - Public	69.202 / 41Extended (with tools)	64.303 / 41Extended (with tools)	+4.90
SWE-bench Verified	88.602 / 106Extended (with tools)	87.603 / 106Extended (with tools)	+1

Claude Opus 4.8 领先 1/1

评测项	Claude Opus 4.8

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

4 个共同 benchmark 上，Claude Opus 4.8 平均高出 3.63 分。

单项差距最大的 benchmark：OSWorld-Verified — Claude Opus 4.8 83.40，Opus 4.7 78（分差 +5.40）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。