DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
目录
目录
  1. 首页/
  2. 博客列表/
  3. 博客详情

Anthropic发布Claude Haiku 4.5:一个不可忽视的低成本模型,1/3的价格,1.5倍的速度,但是有Claude Sonnet 4的水平!

2025/10/19 22:15:00
711 阅读
AnthropicClaudeClaudeHaiku4.5

Anthropic正式发布最新一代入门级模型Claude Haiku 4.5。相较上一代小模型,Haiku 4.5 在编码、推理与“计算机使用/子代理编排”等关键生产力场景上实现逼近甚至局部追平 Sonnet 4,但价格更低、速度更快,定位于“面向规模化落地的高性价比主力”。

Claude Haiku 4.5这个模型非常值得大家关注,因为它的效果从评测来看非常接近Claude Sonnet 4,而价格和速度却非常优秀。官方也说明Claude Code里面的子Agent可以完全用Claude Haiku 4.5代替。

  • 一、从“小而快”到“能干事”:Claude Haiku系列的定位进化与本次核心升级
  • 二、Claude Haiku 4.5最大的竞争力:可能是低价位段大模型的“性能天花板”
  • 三、Claude Haiku 4.5模型的总结和使用方式

一、从“小而快”到“能干事”:Claude Haiku系列的定位进化与本次核心升级

过去一年,Claude系列形成了“Opus(旗舰)—Sonnet(中坚)—Haiku(高效小型)”的产品梯队。

Claude Haiku 系列作为 Claude 产品线中最轻量的成员,过去更多承担“快、便宜、响应灵敏”的角色;但在复杂工程任务(如多步代码修改、跨工具协作、浏览器表单自动化)上曾略显不足。Claude Haiku 4.5 的目标,是把“小”与“能干事”统一起来:在子代理(sub-agents)编排、计算机使用(computer use)与可控推理深度(extended thinking)等真实生产力方面,显著补齐模型“能力密度”。官方博客明确将其定位为“面向AI Agent编码与计算机使用的跃迁”。

Anthropic 在发布中直言:“五个月前仍属SOTA大模型的能力(Claude Sonnet 4),如今有更快更便宜的模型可以替代”。

Claude Haiku 3.5是Anthropic在2024年10月份发布的模型,中间Claude系列,特别是Sonnet和Opus都已经有了好几个版本的迭代,包括Sonnet 3.5、Sonnet 4、Opus 4、Opus 4.1等。时隔一年,Claude Haiku系列终于有了巨大升级。与上一代 Haiku 3.5 相比,Haiku 4.5 的关键升级包括:

  • Haiku系列首次支持推理模式(支持“可控推理深度”):也就是说Haiku 4.5模型支持推理成本的限制,可以通过设置更多的推理过程来提升模型的能力。
  • 更强的工具链与计算机操作(computer use):这部分主要是Agent方向的能力提升,在自动化点按/表单/导航等桌面或网页流程等方面提升明显。

在可验证数据上, Haiku 4.5 在部分评测基准(如SWE-Bench Verified)中进入世界一流的代码模型梯队;同时强调其对并行子代理、快速工具链调用的响应性优势。这意味着在“代码-测试-运行-回归修改”的闭环里,它不再只是“快”,而是能以低延迟持续推动任务前进。

二、Claude Haiku 4.5最大的竞争力:可能是低价位段大模型的“性能天花板”

根据目前官方提供的数据,Claude Haiku 4.5模型基本上达到了上一代中端期间Sonnet 4模型的水平。需要注意的是,尽管Claude Sonnet 4是Anthropic中端模型,但实际上很多人反映这个模型在很多编程任务上不输于Claude Opus 4,与全球最强的模型Gemini 2.5 Pro、GPT-5等相比也是有竞争力的。

TechCrunch 援引官方口径,称 Haiku 4.5 在典型任务上“成本约 1/3、速度超过 2 倍”,而根据Artificial Analysis实测数据,Haiku 4.5的tokens生成速度达到了每秒118个!是Claude Sonnet 4的77的1.5倍左右!快那是肯定快的。

在评测测试方面,Claude Haiku 4.5也是很棒的。我们使用DataLearnerAI的大模型对比工具对比了Claude Haiku 4.5、Claude Sonnet 4和Claude Sonnet 4.5三个模型。

在不带推理过程、不使用工具的情况下,三个模型的评测对比如下:

Haiku 4.5与Sonnet模型对比
Haiku 4.5与Sonnet模型对比
数据来源DataLearnerAI网站:https://www.datalearner.com/compare/popular-compare/haiku-4_5-vs-sonnet-4-vs-sonnet-4_5?thinkingMode=normal&toolUsage=without

可以看到,尽管Claude Haiku 4.5不是在所有评测基准上都好于Claude Sonnet 4,但是差距也不大,甚至在AIME 2025、LiveCodeBench、ARC-AGI-2方面是持平或者优于Claude Sonnet 4的。

我们也对比一下思考模式下三者的差异:

Claude Haiku 4.5与Sonnet模型对比(推理模式)
Claude Haiku 4.5与Sonnet模型对比(推理模式)
数据来源DataLearnerAI网站:https://www.datalearner.com/compare/popular-compare/haiku-4_5-vs-sonnet-4-vs-sonnet-4_5?thinkingMode=thinking&toolUsage=without

可以看到,推理模式下,Claude Haiku 4.5的竞争力也是很强,包括AIME 2025、ARC-AGI-1、HLE等评测,都是超过了Claude Sonnet 4模型,带不带工具也都是类似。

Claude Haiku 4.5 将“小模型能做大事”的曲线向前推了一步。对“要规模部署、要控预算、又要真正把事做完”的团队,性价比极高。

三、Claude Haiku 4.5模型的总结和使用方式

目前Claude Haiku 4.5 已上线官方定价与使用页,可直接在 Claude/开发者控制台中启用。价格:输入 1 美元/100 万tokens,输出 5 美元/100 万tokens;Prompt Caching 写入 1.25 美元/100 万tokens、读取 0.1 美元/100 万tokens(TTL 5 分钟)。相比较Haiku 3.5模型,输入输出价格是有上涨的(上涨25%),不过相比较Sonnet 4和Sonnet 4.5价格还是有明显优势,大约是1/3价格。

还有一点需要注意,Claude Haiku 4.5的最高上下文是200K,而Sonnet 4.5等已经是1000K(100万,beta测试)上下文了。这一点可能是较大的区别。

关于Claude Haiku 4.5的其他信息可以参考DataLearnerAI大模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/claude-haiku-4-5

而前面说的Claude Haiku 4.5和Claude Sonnet 4、Sonnet 4.5模型的对比参考:https://www.datalearner.com/compare/popular-compare/haiku-4_5-vs-sonnet-4-vs-sonnet-4_5

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码
返回博客列表

相关博客

  • Anthropic发布Claude Opus 4.7:编程能力大幅跃升,视觉分辨率提升超3倍,首个搭载网络安全防护机制的旗舰模型!
  • Claude Mythos Preview System Card深度解读:欺骗行为、答案抖动、模型福利等十大关键发现
  • Claude Mythos 是什么?Anthropic最强模型评测、安全能力与Project Glasswing详解
  • 重磅!Anthropic官方数据泄露,正在测试新的大模型Claude Mythos,规模超越Opus,能力实现“阶梯式”飞跃!
  • Anthropic 发布 Cowork:从 Claude Code 的发展历史看 Cowork 的能力与定位,它可能成为普通人的下一代桌面 AI 助手吗?
  • 大模型可以运营自动售货机吗?Anthropic的Project Vend实验:Claude能成功经营一家小店吗?答案是亏损严重还会免费赠送商品!
  • Anthropic发布Claude4,全球最强编程大模型,大幅提升AI Agent系统所需的各项能力,最长可以7小时连续工作,持续工作、工具使用、记忆使用方面大幅提升
  • 大模型的多语言能力来自哪里?大模型是否有自己的内部语言?在英文数据集上学习到的知识可以用中文表达出来吗?

热门博客

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署