Anthropic发布了Claude Opus 4.1:这是一个Claude Opus 4的小幅升级版本,价格和技术参数不变,性能略有提升

标签:#ClaudeOpus# 时间:2025/08/07 23:37:36 作者:小木

Anthropic 在 Opus 4 发布不到三个月后推出 Claude Opus 4.1,宣称“可直接替换”旧版模型。更新聚焦真实世界编码、长链路代理(agentic)任务和细粒度推理,同时保持相同 API 名称结构和计费档位,方便现有应用平滑迁移。


Claude Opus 4.1升级概要

本次的Claude Opus 4.1相比较5月份发布的Claude Opus 4的升级并没有明显的变化,主要体现在更强的真实世界编码表现。在 SWE-bench Verified 评测中成绩提升至 74.5 %,接近此前最高的o3-pro的75%。

企业与社区反馈

  • GitHub 内部评估显示,Opus 4.1 在几乎所有编码维度均优于 Opus 4,尤其在「多文件代码重构」场景提升显著。
  • Rakuten Group 的工程团队发现,4.1 能在大型代码库中精确定位并修正问题,避免多余改动或新 Bug,因此已将其作为日常调试的默认模型。
  • Windsurf 的“初级开发者基准”测试表明,Claude Opus 4.1 较Claude Opus 4 提升约一个标准差,幅度与 Claude Sonnet 3.7到Claude Sonnet 4 的代际跃升相当。

总之,这些改进似乎体现在一些更加精细化的编程方面。

Claude Opus 4 vs Claude Opus 4.1:数据一览

为了更加直观对比Claude Opus 4.1与Claude Opus 4的情况,我们用一个表格进行对比

模型 首次发布 SWE-bench Verified 上下文窗口 价格(输入/输出)
Claude Opus 4 2025-05-22 72.5 % 200 K $15 / $75 每百万 tokens
Claude Opus 4.1 2025-08-05 74.5 % 200 K $15 / $75 每百万 tokens

价格与 API 兼容性完全保持不变,直接将模型名称切换为 claude-opus-4-1-20250805 即可。

简单来说,似乎除了评测结果小幅升级外,其它没有变化。

如何看Claude Opus 4.1的升级

社区对于Claude Opus 4.1的升级似乎觉得有点太少了。但是,对于用户来说,这个升级至少有如下2个好处:

  • 更高性价比:在维持 Opus 4 价格的同时,编码与推理能力再上台阶;结合 Prompt Caching(90 %)与 Batch(50 %)折扣,可继续压缩成本。
  • 无缝迁移:API 端点与参数不变,可直接替换模型名称;不需改动提示或参数即可获得更高编码成功率,适合持续集成场景做快速升级验证。

Claude即将迎来更多升级

Anthropic 表示“更大幅度的升级将在数周内到来”,Opus 4.1 更多是精准与稳定性的补强。

如果你的工作流依赖 Claude,或者你正准备部署面向长文本、复杂推理与庞大代码库的 AI 系统,Opus 4.1 几乎是“无需犹豫”的必须升级的选择。

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
相关博客