DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
AI工具导航
搜索博客
中
EN
加载中...
大模型列表
GPT-4.5
评测分析
GPT-4.5 评测详情
以下是 GPT-4.5 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
GPT-4.5
评测结果
思考模式
全部
常规
综合评估
共 2 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pro
default
86.10
11 / 114
GPQA Diamond
default
71.40
86 / 158
常识问答
共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
default
62.50
7 / 44
编程与软件工程
共 3 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
default
46.40
81 / 105
SWE-bench Verified
default
38
83 / 90
IC SWE-Lancer(Diamond)
default
32.60
5 / 8
数学推理
共 2 项评测
评测名称 / 模式
得分
排名/总数
MATH-500
default
90.70
33 / 42
AIME 2024
default
36.70
54 / 62
常识推理
共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
default
34.50
20 / 27
与其他模型对比