Haiku 4.5

Name: Claude Haiku 4.5
Author: Anthropic

多模态大模型HaikuClaude 4.5

Claude Haiku 4.5

发布时间: 2025-10-15更新于: 2026-06-15 07:18:22.2731,506

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

200K

中文支持

支持

推理能力

Claude Haiku 4.5 是由 Anthropic 发布的 AI 模型，发布时间为 2025-10-15，定位为多模态大模型，上下文长度为 200K，采用不开源许可，在 AIME2025 上取得 96.30 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Haiku 4.5

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

200K tokens

最大输出长度

64K tokens

模型类型

多模态大模型

输入/输出模态

文本、图像 → 文本

发布时间

2025-10-15

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Haiku 4.5

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://claude.ai

Haiku 4.5

官方介绍与博客

官方论文

Introducing Claude Haiku 4.5

DataLearnerAI博客

Anthropic发布Claude Haiku 4.5：一个不可忽视的低成本模型，1/3的价格，1.5倍的速度，但是有Claude Sonnet 4的水平！

Haiku 4.5

API接口信息

接口速度

5/5

暂无公开的 API 定价信息。

Haiku 4.5

评测结果

Haiku 4.5 当前已收录的代表性评测结果包括 AIME2025（20 / 106，得分 96.30）、Terminal-Bench（11 / 35，得分 41）、Claw Bench（11 / 29，得分 89.40）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 12 项评测

评测名称 / 模式

得分

排名/总数

MMLU Pro

常规模式

78 / 126

MMLU Pro

扩展

60 / 126

GPQA Diamond

常规模式

60.50

140 / 180

GPQA Diamond

扩展

73.30

102 / 180

LiveBench

常规模式

45.33

103 / 115

LiveBench

64K

61.32

64 / 115

ARC-AGI

常规模式

14.30

56 / 65

ARC-AGI

扩展

47.70

43 / 65

HLE

常规模式

4.30

161 / 163

HLE

扩展

9.70

139 / 163

ARC-AGI-2

常规模式

1.30

52 / 59

ARC-AGI-2

扩展

4.50

47 / 59

编程与软件工程

共 5 项评测

评测名称 / 模式

得分

排名/总数

SWE-bench Verified

常规模式工具

60.60

77 / 109

SWE-bench Verified

128K工具

73.30

45 / 109

LiveCodeBench

常规模式

91 / 120

LiveCodeBench

扩展

67 / 120

SWE-Bench Pro - Public

扩展工具

39.45

43 / 46

数学推理

共 5 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

常规模式

94 / 106

AIME2025

128K

80.70

57 / 106

AIME2025

128K工具

96.30

20 / 106

FrontierMath

常规模式

4.10

41 / 60

FrontierMath - Tier 4

32K

2.10

56 / 80

AI Agent - 工具使用

共 3 项评测

评测名称 / 模式

得分

排名/总数

Terminal-Bench

常规模式工具

26 / 35

Terminal-Bench

32K工具

11 / 35

MCP-Atlas

常规模式工具

40.20

24 / 24

多模态理解

共 1 项评测

评测名称 / 模式

得分

排名/总数

MMMU

128K

73.20

19 / 28

Agent能力评测

共 1 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench

常规模式工具

40 / 40

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

IF Bench

扩展

54.30

25 / 29

OpenClaw智能体能力综合测评

共 2 项评测

评测名称 / 模式

得分

排名/总数

Claw Bench

思考模式工具

89.40

11 / 29

Pinch Bench

思考模式工具

21 / 37

查看评测深度分析与其他模型对比

和其他模型对比

想自定义其他组合？打开对比工具

Haiku 4.5

发布机构

Anthropic

查看发布机构详情

Claude Haiku 4.5

模型解读

Claude Haiku 4.5的详情可以看DataLearnerAI的博客： https://www.datalearner.com/blog/1051760883300903

Claude Haiku 4.5 由 Anthropic 发布，是 Claude 4.5 系列中主打速度与成本效率的轻量模型，面向实时与高并发应用场景。官方声明其在编码、计算机操作与多代理工作流等任务上的综合表现可与 Sonnet 4 接近，同时具备显著更低的延迟与更优的成本效率。

架构与技术规格（公开信息）

官方未披露参数量与训练数据细节。上下文窗口为 200K tokens。Haiku 4.5 支持文本与图像输入（Text & Image Input），输出为文本。

核心能力与支持模态

（1）文本与代码：面向高并发与低延迟的对话、摘要、代码生成与辅助开发等任务；（2）工具/计算机使用与多代理工作流：强调在复杂工作流中保持稳定响应与自纠错能力；（3）图像理解：支持图像作为输入并进行文本层面的理解与推断（输出为文本）。

性能与基准

官方模型页显示 Haiku 4.5 在 SWE-bench Verified 上得分 73.3%（方法学细节与试验设置见新闻稿附注），并在编码、计算机使用与代理式任务上与 Sonnet 4 保持同级表现。

应用场景与限制

典型应用包括：实时客服/客服代理、低时延对话助手、代码子代理（在多代理系统中的并行子任务执行）、金融数据监控与分析、研究类子代理等。官方系统卡显示该模型在安全评估后以 ASL-2 发布；仍应遵循使用政策并在高风险领域实施必要的人类监督。

访问方式与许可

支持通过 Anthropic API 直接调用（模型名 claude-haiku-4-5），并已在 Amazon Bedrock、Google Cloud Vertex AI 上线。定价（开发者平台）为：$1/百万输入 token、$5/百万输出 token；提示词缓存（Prompt Caching）写入 $1.25/百万 token、读取 $0.10/百万 token（5 分钟 TTL）。模型未开源。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送