DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表GPT-5
GP

GPT-5

GPT-5

发布时间: 2025-08-07更新于: 2025-08-08 14:40:012,090
在线体验GitHubHugging FaceCompare
模型参数
未披露
上下文长度
400K
中文支持
支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

GPT-5

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
400K tokens
最大输出长度
131072 tokens
模型类型
基础大模型
发布时间
2025-08-07
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
0.0 亿 / 不涉及
知识截止
暂无数据
GPT-5

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
https://chat.openai.com/
GPT-5

官方介绍与博客

官方论文
Introducing GPT-5
DataLearnerAI博客
OpenAI发布GPT-5:这是一个包含实时路由的AI系统,而不仅仅是一个模型
GPT-5

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$1.25$10
GPT-5

评测结果

思考模式

综合评估

共 16 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
常规
87.30
68 / 160
GPQA Diamond
常规
85.70
68 / 160
GPQA Diamond
常规
77.80
68 / 160
LiveBench
常规
79.33
2 / 52
LiveBench
常规
78.85
2 / 52
ARC-AGI
常规
65.70
45 / 47
ARC-AGI
常规
56.20
45 / 47
ARC-AGI
常规
44
45 / 47
ARC-AGI
常规
6
45 / 47
HLE
常规
35.20
101 / 112
HLE
常规
24.80
101 / 112
HLE
常规
6.30
101 / 112
ARC-AGI-2
常规
9.90
39 / 39
ARC-AGI-2
常规
7.50
39 / 39
ARC-AGI-2
常规
1.90
39 / 39
ARC-AGI-2
常规
0
39 / 39

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
SWE-bench Verified
常规
72.80
33 / 92
SWE-Bench Pro - Public
常规
36.30
13 / 15

数学推理

共 12 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
常规
99.60
83 / 108
AIME2025
常规
94.60
83 / 108
AIME2025
常规
61.90
83 / 108
IMO-ProofBench
常规
59
2 / 16
IMO 2025
常规
29
2 / 9
FrontierMath
常规
26.30
12 / 57
FrontierMath
常规
24.80
12 / 57
FrontierMath
常规
24.80
12 / 57
IMO-ProofBench Advanced
常规
20
2 / 8
FrontierMath - Tier 4
常规
12.50
15 / 37
FrontierMath - Tier 4
常规
6.30
15 / 37
IMO 2024
常规
11
4 / 10

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
常规
43.80
8 / 35

多模态理解

共 1 项评测
评测名称 / 模式
得分
排名/总数
MMMU
常规
84.20
4 / 20

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
常规
56.70
8 / 27

Agent能力评测

共 3 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench - Telecom
常规
96.70
12 / 32
τ²-Bench - Telecom
常规
95.80
12 / 32
τ²-Bench
常规
80
13 / 36

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
IF Bench
常规
73.10
4 / 27

AI Agent - 信息收集

共 2 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
常规
90
22 / 34
BrowseComp
常规
54.90
22 / 34
查看评测深度分析与其他模型对比
GPT-5

发布机构

OpenAI
OpenAI
查看发布机构详情
GPT-5

模型解读

----------2025年8月7日

OpenAI官方宣布,将在2025年8月7日发布新一代GPT-5模型



----------2025年7月13日

传闻OpenAI会在2025年7月份发布GPT-5,2025年7月13日,推特上泄露出GPT-5的评测结果,但不确定真假。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码