GP

GPT-5

GPT-5

发布时间: 2025-08-071,749
模型参数
未披露
上下文长度
400K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
400K tokens
最大输出长度
131072 tokens
模型类型
暂无数据
发布时间
2025-08-07
模型文件大小
暂无数据
推理模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址

官方介绍与博客

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$1.25$10

评测得分

综合评估

共 16 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamondthinking + 使用工具
87.30
11 / 138
85.70
15 / 138
79.33
1 / 52
LiveBenchmedium
78.85
2 / 52
77.80
49 / 138
65.70
9 / 36
ARC-AGImedium
56.20
15 / 36
44
17 / 36
HLEthinking + 使用工具
35.20
14 / 78
HLEthinking
24.80
25 / 78
9.90
11 / 27
ARC-AGI-2medium
7.50
14 / 27
HLEnormal
6.30
68 / 78
ARC-AGInormal
6
34 / 36
1.90
21 / 27
ARC-AGI-2normal
0
27 / 27

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
72.80
17 / 70

数学推理

共 12 项评测
评测名称 / 模式
得分
排名/总数
AIME2025thinking + 使用工具
99.60
7 / 98
AIME2025thinking
94.60
21 / 98
AIME2025normal
61.90
73 / 98
59
2 / 16
IMO 2025thinking
29
2 / 9
FrontierMathhigh + 使用工具
26.30
5 / 51
24.80
6 / 51
24.80
6 / 51
IMO 2024thinking
11
4 / 10
8.30
5 / 28
6.30
6 / 28

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Benchthinking + 使用工具
43.80
8 / 35

多模态理解

共 1 项评测
评测名称 / 模式
得分
排名/总数
MMMUhigh
84.20
2 / 17

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
56.70
8 / 25

Agent能力评测

共 3 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench - Telecomhigh + 使用工具
96.70
4 / 18
τ²-Bench - Telecomthinking + 使用工具
95.80
5 / 18
τ²-Benchthinking + 使用工具
80
7 / 27

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
73.10
1 / 14

AI Agent - 信息收集

共 2 项评测
评测名称 / 模式
得分
排名/总数
BrowseComphigh + 使用工具
90
1 / 11
BrowseCompthinking + 使用工具
54.90
5 / 11

发布机构

模型解读

----------2025年8月7日

OpenAI官方宣布,将在2025年8月7日发布新一代GPT-5模型



----------2025年7月13日

传闻OpenAI会在2025年7月份发布GPT-5,2025年7月13日,推特上泄露出GPT-5的评测结果,但不确定真假。