Haiku 4.5vsClaude 3.5 Haiku

在 3 个共同 benchmark 中，Haiku 4.5 整体领先：Haiku 4.5 领先 3 项，Claude 3.5 Haiku 领先 0 项，持平 0 项，平均分差 +11.23。

Anthropic · 2025-10-15 · 多模态大模型

Anthropic · 2024-10-22 · 基础大模型

Haiku 4.53 项(100%)(0%)0 项Claude 3.5 Haiku

评测分数

按能力类目分组，每组内按分差大小排列；共 3 项。

Haiku 4.5 领先 2/2

评测项	Haiku 4.5	Claude 3.5 Haiku	分差
GPQA Diamond	60.50144 / 187Normal (No Tools)	41.60170 / 187	+18.90
MMLU Pro	7681 / 132Normal (No Tools)	65105 / 132	+11

Haiku 4.5 领先 1/1

评测项	Haiku 4.5	Claude 3.5 Haiku	分差
FrontierMath	4.1041 / 60Normal (No Tools)	0.3057 / 60	+3.80

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

3 个共同 benchmark 上，Haiku 4.5 平均高出 11.23 分。

单项差距最大的 benchmark：GPQA Diamond — Haiku 4.5 60.50，Claude 3.5 Haiku 41.60（分差 +18.90）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。