Claude Opus 4.8

Name: Claude Opus 4.8
Price: 5 USD
Availability: InStock
Author: Anthropic

推理大模型OpusClaude 4.8

Claude Opus 4.8

发布时间: 2026-05-28更新于: 2026-06-15 07:18:23.471知识截止: 2026-012,137

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

中文支持

支持

推理能力

Claude Opus 4.8 是由 Anthropic 发布的 AI 模型，发布时间为 2026-05-28，定位为推理大模型，上下文长度为 1M，采用不开源许可，在 GDPval-AA 上取得 1890.00 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Claude Opus 4.8

模型基本信息

推理过程

支持

思考模式

思考水平 · 高 (High) (默认)常规模式思考水平 · 低 (Low)思考水平 · 中 (Medium)思考水平 · 极高 (Extra-High)思考水平 · 最高 (Max)

上下文长度

1M tokens

最大输出长度

125K tokens

模型类型

推理大模型

输入/输出模态

文本、图像 → 文本

发布时间

2026-05-28

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

2026-01

Claude Opus 4.8

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

https://claude.ai/

Claude Opus 4.8

官方介绍与博客

官方论文

Introducing Claude Opus 4.8

DataLearnerAI博客

Anthropic发布Claude Opus 4.8：定价不变，编程与智能体能力小幅提升，

Claude Opus 4.8

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$5.00/ 1M	$25.00/ 1M

缓存定价Prompt缓存

类型	有效期	写入	读取
文本	5m	$6.25/ 1M	$0.500/ 1M
文本	1h	$10.00/ 1M	$0.500/ 1M

Claude Opus 4.8

评测结果

Claude Opus 4.8 当前已收录的代表性评测结果包括 GPQA Diamond（6 / 180，得分 93.60）、LiveBench（4 / 115，得分 78.79）、HLE（6 / 164，得分 57.90）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 7 项评测

评测名称 / 模式

得分

排名/总数

GPQA Diamond

高

93.60

6 / 180

LiveBench

低

71.42

33 / 115

LiveBench

中

75.47

12 / 115

LiveBench

高

77.16

6 / 115

LiveBench

深度

78.79

4 / 115

HLE

扩展

49.80

27 / 164

HLE

扩展工具

57.90

6 / 164

编程与软件工程

共 3 项评测

评测名称 / 模式

得分

排名/总数

SWE-bench Verified

扩展工具

88.60

4 / 109

SWE-Bench Pro - Public

扩展工具

69.20

3 / 48

DeepSWE

深度工具

6 / 16

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

Simple Bench

常规模式

64.80

9 / 63

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

高工具联网

84.30

7 / 49

生产力知识

共 1 项评测

评测名称 / 模式

得分

排名/总数

GDPval-AA

扩展工具

1890

1 / 21

AI Agent - 工具使用

共 3 项评测

评测名称 / 模式

得分

排名/总数

OSWorld-Verified

扩展工具

83.40

2 / 20

MCP-Atlas

深度工具

82.20

4 / 25

TerminalBench 2.1

高工具

78.90

11 / 21

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Claude Opus 4.8

发布机构

Anthropic

查看发布机构详情

Claude Opus 4.8

模型解读

Claude Opus 4.8 的定位

Claude Opus 4.8 是 Anthropic 于 2026 年 5 月 28 日发布的 Opus 系列模型更新，官方 API 模型 ID 为 claude-opus-4-8。Anthropic 将其定位为面向复杂推理、长期运行的智能体编码任务和高自主性工作的高能力模型。与 Claude Opus 4.7 相比，Opus 4.8 延续同一 Opus 产品线，但在编码、智能体任务、专业知识工作、长上下文任务执行以及工具调用稳定性方面进行了更新。官方发布页同时说明，该模型已在发布当日面向 Claude API、Claude Platform、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 等渠道开放；面向普通用户和企业用户，可通过 Claude 的 Pro、Max、Team 和 Enterprise 计划使用。

上下文、输出长度与模型规格

Anthropic 未公开 Claude Opus 4.8 的参数量、激活参数量、训练语料规模或完整架构细节，因此参数量字段不应根据外部猜测填写。官方模型文档给出的可验证规格包括：在 Claude API、Amazon Bedrock 与 Vertex AI 上默认支持 1M token 上下文窗口，在 Microsoft Foundry 上为 200K token 上下文窗口；同步 Messages API 的最大输出长度为 128K tokens。官方文档还列出其可靠知识截止时间为 2026 年 1 月，训练数据截止时间为 2026 年 1 月。

模态能力与思考机制

Claude 当前模型文档说明，现行 Claude 模型支持文本与图像输入、文本输出、多语言能力和视觉能力。因此，Claude Opus 4.8 可用于文本理解、图像/PDF/图表等视觉输入理解，以及文本生成任务；公开资料未显示其支持原生音频、视频或 embedding 输出。Opus 4.8 支持 adaptive thinking，但不支持手动设置固定 thinking budget 的旧式 extended thinking。启用方式为在请求中设置 thinking: {type: 'adaptive'}，并通过 effort 参数控制推理深度；如果不显式设置 thinking 字段，请求会以非思考方式运行。官方文档列出的 effort 层级包括 low、medium、high、xhigh 和 max，其中 high 是默认值，xhigh 与 max 用于需要更深推理的任务。

相比 Opus 4.7 的主要变化

Anthropic 的发布说明将 Opus 4.8 描述为在 Opus 4.7 基础上的增量更新。官方文档列出的变化包括：面向长期智能体编码任务的更好长上下文处理、更少 compaction 后偏离任务的情况、更稳定的 reasoning effort 校准，以及更少遗漏必要工具调用的情况。发布页还强调了 honesty 相关改进：在官方评估中，Opus 4.8 相比前代更不容易在其生成代码存在缺陷时不加说明地继续推进，约为前代的四分之一；同时更倾向于标注工作中的不确定性，减少缺乏依据的结论表达。

性能信息与适用场景

Anthropic 官方页面称，Opus 4.8 面向生产级代码、复杂 AI agents 和复杂文档创建等高要求场景。官方页面公开的案例评价还提到，Opus 4.8 在 Online-Mind2Web 浏览器/计算机使用测试中取得 84% 分数，并在法律、金融文档、企业知识工作、长流程代码库修改等工作流中被测试。由于部分完整基准表以图片或系统卡形式发布，若后台需要逐项基准分数，建议后续以 Anthropic 的 Claude Opus 4.8 System Card 为准单独补充。

访问方式、价格与开放性

开发者可通过 Claude API 使用 claude-opus-4-8，也可通过 Anthropic 在 AWS、Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 上的渠道访问。官方标准价格为输入 5 美元/百万 tokens、输出 25 美元/百万 tokens；Prompt caching 价格为 5 分钟 cache write 6.25 美元/百万 tokens、1 小时 cache write 10 美元/百万 tokens、cache hit 与 refresh 0.50 美元/百万 tokens。Fast mode 是 API 的 research preview，通过 speed: 'fast' 启用，官方说明其使用相同模型权重和行为，不是单独模型；其价格为输入 10 美元/百万 tokens、输出 50 美元/百万 tokens。Claude Opus 4.8 未开源代码或 checkpoints，公开访问主要通过 Anthropic 及其云平台合作渠道提供。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送