HA

Haiku 4.5

Claude Haiku 4.5

发布时间: 2025-10-15397
模型参数
未披露
上下文长度
200K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
200K tokens
最大输出长度
65536 tokens
模型类型
暂无数据
发布时间
2025-10-15
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
0.0 亿 / 不涉及
知识截止
暂无数据
推理模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验

官方介绍与博客

API接口信息

接口速度
5/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$1$5
图片$1--
缓存计费Cache
模态输入 Cache输出 Cache
文本$1.25$0.10
图片$1.25--

评测得分

综合评估

共 12 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pronormal
80
44 / 109
MMLU Prothinking
76
61 / 109
GPQA Diamondthinking
73.30
65 / 140
LiveBenchthinking
71.38
17 / 52
60.50
100 / 140
LiveBenchnormal
60.42
43 / 52
ARC-AGIthinking
47.70
16 / 36
ARC-AGInormal
14.30
30 / 36
HLEthinking
9.70
61 / 81
ARC-AGI-2thinking
4.50
19 / 27
HLEnormal
4.30
79 / 81
ARC-AGI-2normal
1.30
23 / 27

编程与软件工程

共 5 项评测
评测名称 / 模式
得分
排名/总数
SWE-bench Verifiedthinking + 使用工具
73.30
17 / 72
62
49 / 99
60.60
46 / 72
51
71 / 99
39.45
3 / 5

数学推理

共 4 项评测
评测名称 / 模式
得分
排名/总数
AIME2025thinking + 使用工具
96.30
17 / 100
AIME2025thinking
80.70
50 / 100
AIME2025normal
39
89 / 100
4.10
34 / 53

AI Agent - 工具使用

共 2 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Benchthinking + 使用工具
41
11 / 35
Terminal-Benchnormal + 使用工具
26
26 / 35

多模态理解

共 1 项评测
评测名称 / 模式
得分
排名/总数
MMMUthinking
73.20
11 / 17

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
τ²-Benchnormal + 使用工具
33
28 / 28

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
IF Benchthinking
54.30
11 / 15

发布机构

模型解读

Claude Haiku 4.5的详情可以看DataLearnerAI的博客: https://www.datalearner.com/blog/1051760883300903 


Claude Haiku 4.5 由 Anthropic 发布,是 Claude 4.5 系列中主打速度与成本效率的轻量模型,面向实时与高并发应用场景。官方声明其在编码、计算机操作与多代理工作流等任务上的综合表现可与 Sonnet 4 接近,同时具备显著更低的延迟与更优的成本效率。

架构与技术规格(公开信息)

官方未披露参数量与训练数据细节。上下文窗口为 200K tokens。Haiku 4.5 支持文本与图像输入(Text & Image Input),输出为文本。

核心能力与支持模态

(1)文本与代码:面向高并发与低延迟的对话、摘要、代码生成与辅助开发等任务;(2)工具/计算机使用与多代理工作流:强调在复杂工作流中保持稳定响应与自纠错能力;(3)图像理解:支持图像作为输入并进行文本层面的理解与推断(输出为文本)。

性能与基准

官方模型页显示 Haiku 4.5 在 SWE-bench Verified 上得分 73.3%(方法学细节与试验设置见新闻稿附注),并在编码、计算机使用与代理式任务上与 Sonnet 4 保持同级表现。

应用场景与限制

典型应用包括:实时客服/客服代理、低时延对话助手、代码子代理(在多代理系统中的并行子任务执行)、金融数据监控与分析、研究类子代理等。官方系统卡显示该模型在安全评估后以 ASL-2 发布;仍应遵循使用政策并在高风险领域实施必要的人类监督。

访问方式与许可

支持通过 Anthropic API 直接调用(模型名 claude-haiku-4-5),并已在 Amazon Bedrock、Google Cloud Vertex AI 上线。定价(开发者平台)为:$1/百万输入 token$5/百万输出 token;提示词缓存(Prompt Caching)写入 $1.25/百万 token、读取 $0.10/百万 token(5 分钟 TTL)。模型未开源。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码