DE

DeepSeek-R1

DeepSeek-R1

发布时间: 2025-01-201,257
模型参数
6710.0
上下文长度
128K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
128K tokens
最大输出长度
暂无数据
模型类型
暂无数据
发布时间
2025-01-20
模型文件大小
134GB
推理模式
暂无模式数据

开源和体验地址

代码开源状态
预训练权重开源
MIT License- 免费商用授权
GitHub 源码
暂无GitHub开源地址
在线体验
暂无在线体验地址

官方介绍与博客

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。

评测得分

综合评估

共 5 项评测
评测名称 / 模式
得分
排名/总数
MMLUnormal
90.80
5 / 59
MMLU Pronormal
84
22 / 107
71.50
65 / 138
LiveBenchnormal
69.41
22 / 52
ARC-AGInormal
15.80
29 / 36

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQAnormal
30.10
21 / 44

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
65.90
39 / 98
49.20
58 / 70

数学推理

共 3 项评测
评测名称 / 模式
得分
排名/总数
MATH-500normal
97.30
12 / 42
AIME 2024normal
79.80
29 / 62
AIME2025normal
70
66 / 98

写作和创作

共 1 项评测
评测名称 / 模式
得分
排名/总数
84.60
11 / 22

发布机构

模型解读

DeepSeekAI发布的推理大模型,是接近OpenAI o1推理大模型的开源版本,完全免费开源,性能强悍,是基于DeepSeek R1 Zero基础上微调后得到的。