Ha

Haiku 4.5

多模态大模型

Claude Haiku 4.5

发布时间: 2025-10-15

246
模型参数(Parameters)
未披露
最高上下文长度(Context Length)
200K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

200K tokens

最长输出结果

65536 tokens

模型类型

多模态大模型

发布时间

2025-10-15

模型预文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode) 思考模式(Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源 - 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 1 美元 / 100万 tokens 5 美元 / 100万 tokens
图片 1 美元 / 100万 tokens --
缓存计费 Cache
模态 输入 Cache 输出 Cache
文本 1.25 美元 / 100万 tokens 0.10 美元 / 100万 tokens
图片 1.25 美元 / 100万 tokens --

Haiku 4.5模型在各大评测榜单的评分

综合评估

共 12 项评测
MMLU Pro normal
80
40 / 105
MMLU Pro thinking
76
57 / 105
GPQA Diamond thinking
73.30
58 / 133
LiveBench thinking
71.38
14 / 48
GPQA Diamond normal
60.50
93 / 133
LiveBench normal
60.42
40 / 48
ARC-AGI thinking
47.70
13 / 32
ARC-AGI normal
14.30
26 / 32
HLE thinking
9.70
48 / 68
ARC-AGI-2 thinking
4.50
14 / 22
HLE normal
4.30
66 / 68
ARC-AGI-2 normal
1.30
18 / 22

编程与软件工程

共 5 项评测
SWE-bench Verified thinking + 使用工具
73.30
13 / 66
LiveCodeBench thinking
62
44 / 94
60.60
40 / 66
LiveCodeBench normal
51
66 / 94
39.45
3 / 5

数学推理

共 4 项评测
AIME2025 thinking + 使用工具
96.30
15 / 93
AIME2025 thinking
80.70
43 / 93
AIME2025 normal
39
82 / 93
FrontierMath normal
4.10
29 / 48

Agent能力评测

共 3 项评测
Terminal-Bench thinking + 使用工具
41
12 / 36
τ²-Bench normal + 使用工具
33
23 / 23
Terminal-Bench normal + 使用工具
26
27 / 36

多模态理解

共 1 项评测
MMMU thinking
73.20
9 / 15

指令跟随

共 1 项评测
IF Bench thinking
54.30
8 / 11

发布机构

Claude Haiku 4.5模型解读

Claude Haiku 4.5的详情可以看DataLearnerAI的博客: https://www.datalearner.com/blog/1051760883300903 


Claude Haiku 4.5 由 Anthropic 发布,是 Claude 4.5 系列中主打速度与成本效率的轻量模型,面向实时与高并发应用场景。官方声明其在编码、计算机操作与多代理工作流等任务上的综合表现可与 Sonnet 4 接近,同时具备显著更低的延迟与更优的成本效率。

架构与技术规格(公开信息)

官方未披露参数量与训练数据细节。上下文窗口为 200K tokens。Haiku 4.5 支持文本与图像输入(Text & Image Input),输出为文本。

核心能力与支持模态

(1)文本与代码:面向高并发与低延迟的对话、摘要、代码生成与辅助开发等任务;(2)工具/计算机使用与多代理工作流:强调在复杂工作流中保持稳定响应与自纠错能力;(3)图像理解:支持图像作为输入并进行文本层面的理解与推断(输出为文本)。

性能与基准

官方模型页显示 Haiku 4.5 在 SWE-bench Verified 上得分 73.3%(方法学细节与试验设置见新闻稿附注),并在编码、计算机使用与代理式任务上与 Sonnet 4 保持同级表现。

应用场景与限制

典型应用包括:实时客服/客服代理、低时延对话助手、代码子代理(在多代理系统中的并行子任务执行)、金融数据监控与分析、研究类子代理等。官方系统卡显示该模型在安全评估后以 ASL-2 发布;仍应遵循使用政策并在高风险领域实施必要的人类监督。

访问方式与许可

支持通过 Anthropic API 直接调用(模型名 claude-haiku-4-5),并已在 Amazon Bedrock、Google Cloud Vertex AI 上线。定价(开发者平台)为:$1/百万输入 token$5/百万输出 token;提示词缓存(Prompt Caching)写入 $1.25/百万 token、读取 $0.10/百万 token(5 分钟 TTL)。模型未开源。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat