Anthropic Claude Opus 4.5
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
| Modality | Input | Output |
|---|---|---|
| Text | $5 | $25 |
| Modality | Input cache | Output cache |
|---|---|---|
| Text | $6.25 | $0.5 |
Claude Opus 4.5 currently shows benchmark results led by MMLU Pro (2 / 116, score 90), SWE-bench Verified (4 / 94, score 80.90), LiveCodeBench (5 / 109, score 87). This page also consolidates core specs, context limits, and API pricing so you can evaluate the model from benchmark results and deployment constraints together.
Claude Opus 4.5 是 Anthropic 2025 年发布的最新旗舰模型,是目前 Claude 系列中智能水平最高的一档。官方将其定位为当前最强的 Claude,用于复杂软件工程、长程推理、高难度 Agent 任务以及办公自动化等场景。与前代 Opus 4.1、以及同代的 Sonnet 4.5、Haiku 4.5 相比,它在代码能力、长上下文利用、工具调用效率和安全对齐等方面都有明显提升。Anthropic+1
这意味着 Opus 4.5 对 2025 年上半年之前的技术、产品与行业信息有较完整覆盖,对之后的事件了解有限。
单位:百万 tokens(MTok)
相较于上一代 Opus 4 / 4.1 的 15 / 75 美元,Opus 4.5 的价格整体下调约 66%,官方明确说明这是一次“旗舰模型价格下探”,让 Opus 级别能力更容易被日常使用。WinBuzzer+1
对用户来说,这意味着在很多任务上可以同时获得:更高质量 + 更少 token + 可控推理深度。
这一部分可以直接作为你在 DataLearnerAI 上的“评测摘要区块”。
你在 DataLearnerAI 上可以简要写作: “SWE-bench Verified:≈80.9%,在公开结果中处于领先水平,相比 Sonnet 4.5 进一步提升。”
Anthropic 在官方文章中展示了多个编程与多语言相关基准的对比图:Anthropic
可以在条目中概括为:“多语言代码编辑任务显著优于 Sonnet 4.5,在 Aider Polyglot 基准上有 10%+ 的绝对提升。”
官方博客中还给出了多项“Agent / 电脑使用”相关基准:Anthropic
你在条目里可以总结为一段话:
“在多项 Agent 与电脑使用相关基准(BrowseComp-Plus、Vending-Bench、Terminal Bench 等)中,Claude Opus 4.5 相比 Sonnet 4.5 均有两位数幅度的提升,尤其在长程任务稳定性和收益类指标上优势明显。”
Anthropic 还披露了一些内部评估:Anthropic
结合官方模型对比:Claude 控制台+1
--------------------以下是旧消息,2025年11月25日,Anthropic官方已经发布了Claude Opus 4.5模型了---------------
状态说明:截至当前(2025-11-20),Anthropic 尚未正式发布「Claude Opus 4.5」,相关信息来自开发者社区与社交媒体上的界面/接口泄露与传闻。以下内容仅为对公开可见线索的客观汇总。
多名开发者在 X 与开发者社区称,在 Claude Code CLI 的请求或 Pull Request 讨论中短暂出现了「Opus 4.5」的模型标识;另有多条爆料称该模型的内部代号为「Neptune V6」,并已进入外部红队(red-teaming)阶段,指向其为 Claude 4.5 系列中的高端/前沿版本(对标已发布的 Sonnet 4.5 / Haiku 4.5)。
可查线索示例:X 上关于「Opus 4.5」在 CLI 请求中被发现的贴文;媒体与社区贴文对「Neptune V6」与即将发布的说法进行了二次报道与讨论。
官方尚未披露任何参数规模、架构形态(如是否为 MoE)、训练数据或上下文窗口等技术指标。基于谨慎原则,本条暂不作推测。
官方未披露。结合 Claude 4.1 Opus 与 Sonnet 4.5 的既有定位,外界普遍推测 Opus 4.5 仍将面向复杂推理、长流程编排与高强度编码/工具使用等场景,但缺乏可验证数据,暂不下定论。
暂无官方基准数据或系统卡可引用,故不填。
因未发布且无正式文档,不提供应用建议或限制说明。
暂无公开的 API 型号名、定价与许可信息。待官方公告为准。
注:以上为对公开可见线索的客观转述与归纳,非官方立场,后续以 Anthropic 正式发布为准。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
