GPT-5-Nano 评测详情

GPT-5-Nano 当前已收录的代表性评测结果包括 FrontierMath(31 / 60,得分 8.30)、FrontierMath - Tier 4(56 / 80,得分 2.10)、LiveBench(97 / 115,得分 48.62)。

评测结果

GPT-5-Nano

评测结果

思考模式
工具使用

多模态理解

共 2 项评测
评测名称 / 模式
得分
排名/总数
78.30
5 / 5
57.60
28 / 28

数学推理

共 4 项评测
评测名称 / 模式
得分
排名/总数
8.30
31 / 60
7.20
33 / 60
FrontierMath - Tier 4
思考水平·中
2.10
56 / 80
FrontierMath - Tier 4
思考水平·高
0
72 / 80

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
LiveBench
常规模式
48.56
98 / 115
LiveBench
思考水平·低
34.34
113 / 115
LiveBench
思考水平·高
48.62
97 / 115

OpenClaw智能体能力综合测评

共 1 项评测
评测名称 / 模式
得分
排名/总数
Pinch Bench
开启思考工具
68.80
33 / 37