Anthropic发布了Claude Opus 4.1:这是一个Claude Opus 4的小幅升级版本,价格和技术参数不变,性能略有提升
425 阅读
Anthropic 在 Opus 4 发布不到三个月后推出 Claude Opus 4.1,宣称“可直接替换”旧版模型。更新聚焦真实世界编码、长链路代理(agentic)任务和细粒度推理,同时保持相同 API 名称结构和计费档位,方便现有应用平滑迁移。

Claude Opus 4.1升级概要
本次的Claude Opus 4.1相比较5月份发布的Claude Opus 4的升级并没有明显的变化,主要体现在更强的真实世界编码表现。在 SWE-bench Verified 评测中成绩提升至 74.5 %,接近此前最高的o3-pro的75%。
企业与社区反馈
- GitHub 内部评估显示,Opus 4.1 在几乎所有编码维度均优于 Opus 4,尤其在「多文件代码重构」场景提升显著。
- Rakuten Group 的工程团队发现,4.1 能在大型代码库中精确定位并修正问题,避免多余改动或新 Bug,因此已将其作为日常调试的默认模型。
- Windsurf 的“初级开发者基准”测试表明,Claude Opus 4.1 较Claude Opus 4 提升约一个标准差,幅度与 Claude Sonnet 3.7到Claude Sonnet 4 的代际跃升相当。
总之,这些改进似乎体现在一些更加精细化的编程方面。
Claude Opus 4 vs Claude Opus 4.1:数据一览
为了更加直观对比Claude Opus 4.1与Claude Opus 4的情况,我们用一个表格进行对比
