Claude Sonnet 4.6vsClaude Sonnet 3.7

在 7 个共同 benchmark 中,Claude Sonnet 4.6 整体领先:Claude Sonnet 4.6 领先 7 项,Claude Sonnet 3.7 领先 0 项,持平 0 项,平均分差 +26.76。

Anthropic
Claude Sonnet 4.6

Anthropic · 2026-02-17 · 聊天大模型

Anthropic
Claude Sonnet 3.7

Anthropic · 2025-02-25 · 聊天大模型

Claude Sonnet 4.67 (100%)(0%)0 Claude Sonnet 3.7

评测分数

按能力类目分组,每组内按分差大小排列;共 7 项。

General Knowledge

Claude Sonnet 4.6 领先 2/2
评测项Claude Sonnet 4.6Claude Sonnet 3.7分差
HLE4925 / 15710.30131 / 157+38.70
GPQA Diamond89.9021 / 1787788 / 178+12.90

Agent Level Benchmark

Claude Sonnet 4.6 领先 1/1
评测项Claude Sonnet 4.6Claude Sonnet 3.7分差
τ²-Bench - Telecom97.909 / 355531 / 35+42.90

AI Agent - Tool Usage

Claude Sonnet 4.6 领先 1/1
评测项Claude Sonnet 4.6Claude Sonnet 3.7分差
OSWorld-Verified72.5010 / 182818 / 18+44.50

Coding and Software Engineer

Claude Sonnet 4.6 领先 1/1
评测项Claude Sonnet 4.6Claude Sonnet 3.7分差
SWE-bench Verified79.6017 / 10870.3055 / 108+9.30

Long Context

Claude Sonnet 4.6 领先 1/1
评测项Claude Sonnet 4.6Claude Sonnet 3.7分差
AA-LCR711 / 136113 / 13+10

Productivity Knowledge

Claude Sonnet 4.6 领先 1/1
评测项Claude Sonnet 4.6Claude Sonnet 3.7分差
GDPval-AA5711 / 212820 / 21+29

规格对比

字段Claude Sonnet 4.6Claude Sonnet 3.7
发布机构AnthropicAnthropic
发布时间2026-02-172025-02-25
模型类型聊天大模型聊天大模型
架构稠密模型稠密模型
参数规模暂无数据暂无数据
上下文长度1M128K
最大输出8K暂无数据

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项Claude Sonnet 4.6Claude Sonnet 3.7
文本输入$3 / 1M tokens暂无公开价格
文本输出$15 / 1M tokens暂无公开价格
缓存读取$0.3 / 1M tokens暂无公开价格
缓存写入$3.75 / 1M tokens暂无公开价格

部分模型公开价格不完整,缺失字段按"暂无公开价格"展示。

小结

  • Claude Sonnet 4.6在以下类目领先:General Knowledge (2/2)、Agent Level Benchmark (1/1)、AI Agent - Tool Usage (1/1)、Coding and Software Engineer (1/1)、Long Context (1/1)、Productivity Knowledge (1/1)

7 个共同 benchmark 上,Claude Sonnet 4.6 平均高出 26.76 分。

单项差距最大的 benchmark:OSWorld-Verified — Claude Sonnet 4.6 72.50,Claude Sonnet 3.7 28(分差 +44.50)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。