DataLearnerAI
Toggle menu
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools
搜索博客
中
EN
加载中...
Grok 3 评测详情 | DataLearnerAI
大模型列表
Grok 3
评测分析
Grok 3 评测详情
以下是 Grok 3 在各项评测中的得分数据与模型对比。深度分析报告正在准备中。
评测结果
Grok 3
评测结果
思考模式
全部
常规
综合评估
共 1 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
normal
80.40
58 / 160
常识问答
共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
normal
43.40
16 / 45
数学推理
共 4 项评测
评测名称 / 模式
得分
排名/总数
AIME 2024
normal
84.20
22 / 62
AIME2025
normal
77.10
63 / 107
FrontierMath
normal
3.80
40 / 55
FrontierMath - Tier 4
normal
0.01
27 / 34
编程与软件工程
共 1 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
normal
70.60
40 / 106
与其他模型对比