DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools
搜索博客
中
EN
加载中...
大模型列表
GPT-5
评测分析
GPT-5 评测详情
以下是 GPT-5 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
GPT-5
评测结果
思考模式
全部
常规
思考
思考模式细分 (4)
全部
默认 (thinking)
thinking
high
low
工具使用
全部
使用工具
不使用工具
综合评估
共 2 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
thinking
使用工具
87.30
24 / 160
HLE
thinking
使用工具
35.20
33 / 114
数学推理
共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
thinking
使用工具
99.60
9 / 107
AI Agent - 工具使用
共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
thinking
使用工具
43.80
8 / 35
Agent能力评测
共 2 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench - Telecom
thinking
使用工具
95.80
12 / 33
τ²-Bench
thinking
使用工具
80
16 / 39
AI Agent - 信息收集
共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
thinking
使用工具
54.90
21 / 33
与其他模型对比