DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools
搜索博客
中
EN
加载中...
GPT-5.4 nano 评测详情 | DataLearnerAI
大模型列表
GPT-5.4 nano
评测分析
GPT-5.4 nano 评测详情
以下是 GPT-5.4 nano 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
GPT-5.4 nano
评测结果
思考模式
全部
思考
思考模式细分 (1)
全部
默认 (高)
工具使用
全部
使用工具
不使用工具
综合评估
共 3 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
极高
82.80
46 / 160
HLE
极高
24.30
55 / 114
HLE
极高
使用工具
37.70
29 / 114
多模态理解
共 2 项评测
评测名称 / 模式
得分
排名/总数
MMMU
极高
66.10
26 / 27
MMMU
极高
使用工具
69.50
24 / 27
编程与软件工程
共 1 项评测
评测名称 / 模式
得分
排名/总数
SWE-Bench Pro - Public
极高
使用工具
52.40
8 / 19
Agent能力评测
共 1 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench - Telecom
极高
使用工具
92.50
19 / 33
AI Agent - 工具使用
共 3 项评测
评测名称 / 模式
得分
排名/总数
Terminal Bench 2.0
极高
使用工具
46.30
20 / 24
OSWorld-Verified
极高
使用工具
39
9 / 10
Tool Decathlon
极高
使用工具
35.50
3 / 3
与其他模型对比