Haiku 4.5vsClaude 3.5 Haiku
在 3 个共同 benchmark 中,Haiku 4.5 整体领先:Haiku 4.5 领先 3 项,Claude 3.5 Haiku 领先 0 项,持平 0 项,平均分差 +11.23。
Haiku 4.5
Anthropic · 2025-10-15 · 多模态大模型
Claude 3.5 Haiku
Anthropic · 2024-10-22 · 基础大模型
Haiku 4.53 项(100%)(0%)0 项Claude 3.5 Haiku
评测分数
按能力类目分组,每组内按分差大小排列;共 3 项。
综合评估
Haiku 4.5 领先 2/2| 评测项 | Haiku 4.5 | Claude 3.5 Haiku | 分差 |
|---|---|---|---|
| GPQA Diamond | 60.50135 / 175Normal (No Tools) | 41.60159 / 175 | +18.90 |
| MMLU Pro | 7676 / 124Normal (No Tools) | 6599 / 124 | +11 |
数学推理
Haiku 4.5 领先 1/1| 评测项 | Haiku 4.5 | Claude 3.5 Haiku | 分差 |
|---|---|---|---|
| FrontierMath |
规格对比
| 字段 | Haiku 4.5 | Claude 3.5 Haiku |
|---|---|---|
| 发布机构 | Anthropic | Anthropic |
| 发布时间 | 2025-10-15 | 2024-10-22 |
| 模型类型 | 多模态大模型 | 基础大模型 |
| 架构 | 稠密模型 | 稠密模型 |
| 参数规模 | 0.0 | 0.0 |
| 上下文长度 | 200K | 200K |
| 最大输出 | 65536 | 暂无数据 |
API 调用价格
价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。
| 价格项 | Haiku 4.5 | Claude 3.5 Haiku |
|---|---|---|
| 文本输入 | 1 美元 / 100万 tokens | 暂无公开价格 |
| 文本输出 | 5 美元 / 100万 tokens | 暂无公开价格 |
| 缓存读取 | 1.25 美元 / 100万 tokens | 暂无公开价格 |
| 缓存写入 | 0.10 美元 / 100万 tokens | 暂无公开价格 |
部分模型公开价格不完整,缺失字段按"暂无公开价格"展示。
小结
- Haiku 4.5在以下类目领先:综合评估 (2/2)、数学推理 (1/1)
3 个共同 benchmark 上,Haiku 4.5 平均高出 11.23 分。
单项差距最大的 benchmark:GPQA Diamond — Haiku 4.5 60.50,Claude 3.5 Haiku 41.60(分差 +18.90)。
本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。