DataLearner logoDataLearnerAI
AI Tech Blogs
Leaderboards
Benchmarks
Models
Resources
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogGPT-5
GP

GPT-5

GPT-5

Release date: 2025-08-07更新于: 2025-08-08 14:40:011,928
Live demoGitHubHugging Face
Parameters
Not disclosed
Context length
400K
Chinese support
Supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Model basics

Reasoning traces
Supported
Context length
400K tokens
Max output length
131072 tokens
Model type
基础大模型
Release date
2025-08-07
Model file size
No data
MoE architecture
No
Total params / Active params
0.0B / N/A
Knowledge cutoff
No data
Inference modes
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)深度思考(Deeper Thinking Mode)

Open source & experience

Code license
不开源
Weights license
不开源- 不开源
GitHub repo
GitHub link unavailable
Hugging Face
Hugging Face link unavailable
Live demo
https://chat.openai.com/

Official resources

Paper
Introducing GPT-5
DataLearnerAI blog
OpenAI发布GPT-5:这是一个包含实时路由的AI系统,而不仅仅是一个模型

API details

API speed
3/5
💡Default unit: $/1M tokens. If vendors use other units, follow their published pricing.
Standard pricingStandard
ModalityInputOutput
Text$1.25$10

Benchmark Scores

综合评估

16 evaluations
Benchmark / mode
Score
Rank/total
GPQA Diamondthinking + 使用工具
87.30
13 / 144
GPQA Diamondhigh
85.70
17 / 144
LiveBenchhigh
79.33
1 / 52
LiveBenchmedium
78.85
2 / 52
GPQA Diamondnormal
77.80
53 / 144
ARC-AGIhigh
65.70
9 / 38
ARC-AGImedium
56.20
16 / 38
ARC-AGIlow
44
19 / 38
HLEthinking + 使用工具
35.20
17 / 88
HLEthinking
24.80
30 / 88
ARC-AGI-2high
9.90
11 / 27
ARC-AGI-2medium
7.50
14 / 27
HLEnormal
6.30
77 / 88
ARC-AGInormal
6
36 / 38
ARC-AGI-2low
1.90
21 / 27
ARC-AGI-2normal
0
27 / 27

编程与软件工程

2 evaluations
Benchmark / mode
Score
Rank/total
SWE-bench Verifiedhigh
72.80
22 / 78
SWE-Bench Pro - Publichigh
36.30
5 / 6

数学推理

12 evaluations
Benchmark / mode
Score
Rank/total
AIME2025thinking + 使用工具
99.60
8 / 104
AIME2025thinking
94.60
25 / 104
AIME2025normal
61.90
79 / 104
IMO-ProofBenchthinking
59
2 / 16
IMO 2025thinking
29
2 / 9
FrontierMathhigh + 使用工具
26.30
6 / 52
FrontierMathhigh
24.80
7 / 52
FrontierMathmedium
24.80
7 / 52
IMO-ProofBench Advancedthinking
20
2 / 8
FrontierMath - Tier 4high
12.50
7 / 32
IMO 2024thinking
11
4 / 10
FrontierMath - Tier 4medium
6.30
10 / 32

AI Agent - 工具使用

1 evaluations
Benchmark / mode
Score
Rank/total
Terminal-Benchthinking + 使用工具
43.80
8 / 35

多模态理解

1 evaluations
Benchmark / mode
Score
Rank/total
MMMUhigh
84.20
2 / 17

常识推理

1 evaluations
Benchmark / mode
Score
Rank/total
Simple Benchhigh
56.70
8 / 27

Agent能力评测

3 evaluations
Benchmark / mode
Score
Rank/total
τ²-Bench - Telecomhigh + 使用工具
96.70
4 / 21
τ²-Bench - Telecomthinking + 使用工具
95.80
6 / 21
τ²-Benchthinking + 使用工具
80
10 / 33

指令跟随

1 evaluations
Benchmark / mode
Score
Rank/total
IF Benchhigh
73.10
1 / 18

AI Agent - 信息收集

2 evaluations
Benchmark / mode
Score
Rank/total
BrowseComphigh + 使用工具
90
1 / 19
BrowseCompthinking + 使用工具
54.90
8 / 19

Publisher

OpenAI
OpenAI
View publisher details

Model Overview

----------2025年8月7日

OpenAI官方宣布,将在2025年8月7日发布新一代GPT-5模型



----------2025年7月13日

传闻OpenAI会在2025年7月份发布GPT-5,2025年7月13日,推特上泄露出GPT-5的评测结果,但不确定真假。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码