Haiku 4.5vsClaude 3.5 Haiku

在 3 个共同 benchmark 中,Haiku 4.5 整体领先:Haiku 4.5 领先 3 项,Claude 3.5 Haiku 领先 0 项,持平 0 项,平均分差 +11.23。

Anthropic
Haiku 4.5

Anthropic · 2025-10-15 · 多模态大模型

Anthropic
Claude 3.5 Haiku

Anthropic · 2024-10-22 · 基础大模型

Haiku 4.53 (100%)(0%)0 Claude 3.5 Haiku

评测分数

按能力类目分组,每组内按分差大小排列;共 3 项。

General Knowledge

Haiku 4.5 领先 2/2
评测项Haiku 4.5Claude 3.5 Haiku分差
GPQA Diamond60.50138 / 178Normal (No Tools)41.60162 / 178+18.90
MMLU Pro7678 / 126Normal (No Tools)65101 / 126+11

Math and Reasoning

Haiku 4.5 领先 1/1
评测项Haiku 4.5Claude 3.5 Haiku分差
FrontierMath4.1041 / 60Normal (No Tools)0.3057 / 60+3.80

规格对比

字段Haiku 4.5Claude 3.5 Haiku
发布机构AnthropicAnthropic
发布时间2025-10-152024-10-22
模型类型多模态大模型基础大模型
架构稠密模型稠密模型
参数规模暂无数据暂无数据
上下文长度200K200K
最大输出64K暂无数据

小结

  • Haiku 4.5在以下类目领先:General Knowledge (2/2)、Math and Reasoning (1/1)

3 个共同 benchmark 上,Haiku 4.5 平均高出 11.23 分。

单项差距最大的 benchmark:GPQA Diamond — Haiku 4.5 60.50,Claude 3.5 Haiku 41.60(分差 +18.90)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。