Claude Haiku 4.5
支持
200K tokens
65536 tokens
多模态大模型
2025-10-15
默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。
| 模态 | 输入 | 输出 |
|---|---|---|
| 文本 | 1 美元 / 100万 tokens | 5 美元 / 100万 tokens |
| 图片 | 1 美元 / 100万 tokens |
| 模态 | 输入 Cache | 输出 Cache |
|---|---|---|
| 文本 | 1.25 美元 / 100万 tokens | 0.10 美元 / 100万 tokens |
| 图片 | 1.25 美元 / 100万 tokens |
Claude Haiku 4.5 由 Anthropic 发布,是 Claude 4.5 系列中主打速度与成本效率的轻量模型,面向实时与高并发应用场景。官方声明其在编码、计算机操作与多代理工作流等任务上的综合表现可与 Sonnet 4 接近,同时具备显著更低的延迟与更优的成本效率。
官方未披露参数量与训练数据细节。上下文窗口为 200K tokens。Haiku 4.5 支持文本与图像输入(Text & Image Input),输出为文本。
(1)文本与代码:面向高并发与低延迟的对话、摘要、代码生成与辅助开发等任务;(2)工具/计算机使用与多代理工作流:强调在复杂工作流中保持稳定响应与自纠错能力;(3)图像理解:支持图像作为输入并进行文本层面的理解与推断(输出为文本)。
官方模型页显示 Haiku 4.5 在 SWE-bench Verified 上得分 73.3%(方法学细节与试验设置见新闻稿附注),并在编码、计算机使用与代理式任务上与 Sonnet 4 保持同级表现。
典型应用包括:实时客服/客服代理、低时延对话助手、代码子代理(在多代理系统中的并行子任务执行)、金融数据监控与分析、研究类子代理等。官方系统卡显示该模型在安全评估后以 ASL-2 发布;仍应遵循使用政策并在高风险领域实施必要的人类监督。
支持通过 Anthropic API 直接调用(模型名 claude-haiku-4-5),并已在 Amazon Bedrock、Google Cloud Vertex AI 上线。定价(开发者平台)为:$1/百万输入 token、$5/百万输出 token;提示词缓存(Prompt Caching)写入 $1.25/百万 token、读取 $0.10/百万 token(5 分钟 TTL)。模型未开源。
关注DataLearnerAI微信公众号,接受最新大模型资讯