QwQ-32B 评测详情

QwQ-32B 当前已收录的代表性评测结果包括 AIME 2024(29 / 62,得分 79.50)、MMLU Pro(78 / 126,得分 76)、MATH-500(33 / 44,得分 91)。

评测结果

QwQ-32B

评测结果

思考模式

综合评估

共 2 项评测
评测名称 / 模式
得分
排名/总数
76
78 / 126
58
144 / 179

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
19
39 / 39

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
91
33 / 44
79.50
29 / 62