Claude Opus 4.8
Claude Opus 4.8 是由 Anthropic 发布的 AI 模型,发布时间为 2026-05-28,定位为 推理大模型,上下文长度为 1M,采用 不开源 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
| 类型 | 适用条件 | 输入 | 输出 |
|---|---|---|---|
| 文本 | - | $5.00/ 1M | $25.00/ 1M |
| 类型 | 有效期 | 写入 | 读取 |
|---|---|---|---|
| 文本 | 5m | $6.25/ 1M | $0.500/ 1M |
| 文本 | 1h | $10.00/ 1M | $0.500/ 1M |
Claude Opus 4.8 当前已收录的代表性评测结果包括 SWE-bench Verified(2 / 106,得分 88.60)、HLE(4 / 156,得分 57.90)、GDPval-AA(1 / 21,得分 1890)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。
Claude Opus 4.8 是 Anthropic 于 2026 年 5 月 28 日发布的 Opus 系列模型更新,官方 API 模型 ID 为 claude-opus-4-8。Anthropic 将其定位为面向复杂推理、长期运行的智能体编码任务和高自主性工作的高能力模型。与 Claude Opus 4.7 相比,Opus 4.8 延续同一 Opus 产品线,但在编码、智能体任务、专业知识工作、长上下文任务执行以及工具调用稳定性方面进行了更新。官方发布页同时说明,该模型已在发布当日面向 Claude API、Claude Platform、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 等渠道开放;面向普通用户和企业用户,可通过 Claude 的 Pro、Max、Team 和 Enterprise 计划使用。
Anthropic 未公开 Claude Opus 4.8 的参数量、激活参数量、训练语料规模或完整架构细节,因此参数量字段不应根据外部猜测填写。官方模型文档给出的可验证规格包括:在 Claude API、Amazon Bedrock 与 Vertex AI 上默认支持 1M token 上下文窗口,在 Microsoft Foundry 上为 200K token 上下文窗口;同步 Messages API 的最大输出长度为 128K tokens。官方文档还列出其可靠知识截止时间为 2026 年 1 月,训练数据截止时间为 2026 年 1 月。
Claude 当前模型文档说明,现行 Claude 模型支持文本与图像输入、文本输出、多语言能力和视觉能力。因此,Claude Opus 4.8 可用于文本理解、图像/PDF/图表等视觉输入理解,以及文本生成任务;公开资料未显示其支持原生音频、视频或 embedding 输出。Opus 4.8 支持 adaptive thinking,但不支持手动设置固定 thinking budget 的旧式 extended thinking。启用方式为在请求中设置 thinking: {type: 'adaptive'},并通过 effort 参数控制推理深度;如果不显式设置 thinking 字段,请求会以非思考方式运行。官方文档列出的 effort 层级包括 low、medium、high、xhigh 和 max,其中 high 是默认值,xhigh 与 max 用于需要更深推理的任务。
Anthropic 的发布说明将 Opus 4.8 描述为在 Opus 4.7 基础上的增量更新。官方文档列出的变化包括:面向长期智能体编码任务的更好长上下文处理、更少 compaction 后偏离任务的情况、更稳定的 reasoning effort 校准,以及更少遗漏必要工具调用的情况。发布页还强调了 honesty 相关改进:在官方评估中,Opus 4.8 相比前代更不容易在其生成代码存在缺陷时不加说明地继续推进,约为前代的四分之一;同时更倾向于标注工作中的不确定性,减少缺乏依据的结论表达。
Anthropic 官方页面称,Opus 4.8 面向生产级代码、复杂 AI agents 和复杂文档创建等高要求场景。官方页面公开的案例评价还提到,Opus 4.8 在 Online-Mind2Web 浏览器/计算机使用测试中取得 84% 分数,并在法律、金融文档、企业知识工作、长流程代码库修改等工作流中被测试。由于部分完整基准表以图片或系统卡形式发布,若后台需要逐项基准分数,建议后续以 Anthropic 的 Claude Opus 4.8 System Card 为准单独补充。
开发者可通过 Claude API 使用 claude-opus-4-8,也可通过 Anthropic 在 AWS、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 上的渠道访问。官方标准价格为输入 5 美元/百万 tokens、输出 25 美元/百万 tokens;Prompt caching 价格为 5 分钟 cache write 6.25 美元/百万 tokens、1 小时 cache write 10 美元/百万 tokens、cache hit 与 refresh 0.50 美元/百万 tokens。Fast mode 是 API 的 research preview,通过 speed: 'fast' 启用,官方说明其使用相同模型权重和行为,不是单独模型;其价格为输入 10 美元/百万 tokens、输出 50 美元/百万 tokens。Claude Opus 4.8 未开源代码或 checkpoints,公开访问主要通过 Anthropic 及其云平台合作渠道提供。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
