Claude3-Opus

Name: Claude3-Opus
Price: 7.5 USD
Availability: InStock
Author: Anthropic

多模态大模型OpusClaude 3

Claude3-Opus

发布时间: 2024-03-04更新于: 2024-04-18 08:32:011,007

在线体验GitHubHugging FaceCompare

模型参数

未披露

上下文长度

200K

中文支持

支持

推理能力

Claude3-Opus 是由 Anthropic 发布的 AI 模型，发布时间为 2024-03-04，定位为多模态大模型，上下文长度为 200K，采用不开源许可，在 HellaSwag 上取得 95.40 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Claude3-Opus

模型基本信息

推理过程

不支持

思考模式

不支持思考模式

上下文长度

200K tokens

最大输出长度

暂无数据

模型类型

多模态大模型

输入/输出模态

暂无数据

发布时间

2024-03-04

模型文件大小

暂无数据

MoE架构

否

总参数 / 激活参数

暂无数据 / 不涉及

知识截止

暂无数据

Claude3-Opus

开源和体验地址

代码开源状态

不开源

预训练权重开源

不开源

GitHub 源码

暂无GitHub开源地址

Hugging Face

暂无开源HuggingFace地址

在线体验

暂无在线体验地址

Claude3-Opus

官方介绍与博客

官方论文

Introducing the next generation of Claude

DataLearnerAI博客

评测结果超过GPT-4，Anthropic发布第三代大语言模型Claude3，具有多模态能力，实际评测表现优秀！

Claude3-Opus

API接口信息

接口速度

暂无数据

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$15.00/ 1M	$75.00/ 1M

批量模式

类型	适用条件	输入	输出
文本	-	$7.50/ 1M	$37.50/ 1M

缓存定价Prompt缓存

类型	有效期	写入	读取
文本	-	$18.75/ 1M	$1.50/ 1M

Claude3-Opus

评测结果

Claude3-Opus 当前已收录的代表性评测结果包括 GSM8K（8 / 26，得分 95）、HellaSwag（1 / 3，得分 95.40）、MMLU（27 / 65，得分 86.80）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总数

MMLU

86.80

27 / 65

MMLU Pro

68.45

95 / 126

GPQA Diamond

50.40

154 / 180

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

GSM8K

8 / 26

MATH

60.10

31 / 42

编程与软件工程

共 1 项评测

评测名称 / 模式

得分

排名/总数

HumanEval

84.90

21 / 39

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

HellaSwag

95.40

1 / 3

阅读理解

共 1 项评测

评测名称 / 模式

得分

排名/总数

DROP

83.10

6 / 9

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

Claude3-Opus

发布机构

Anthropic

查看发布机构详情

Claude3-Opus

模型解读

Claude3-Opus是Anthropic公司发布的第三代多模态大语言模型。第三代的Claude-3模型包含3个版本，这里说的Claude3-Opus是其中能力最强的模型。各项评测人任务结果都非常好，甚至超过了GPT-4。

在多模态方面，Claude3-Opus也有强大的能力。

Claude2最受诟病的就是无效的拒绝回答。由于Anthropic在对齐方面做了严格的工作，导致Claude2.1经常出现拒绝回答的情况。在Claude3-Opus上。Anthropic做了改进，在内部测试中，Claude2.1错误地拒绝比例大概在26%左右，而Claude3-Opus上这个比例下降到了11%，进步明显！

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送