Qwen2.5-32B 评测详情

Qwen2.5-32B 当前已收录的代表性评测结果包括 GSM8K（5 / 26，得分 95.90）、MATH（10 / 42，得分 83.10）、MBPP（8 / 28，得分 84）。

评测结果

Qwen2.5-32B

评测结果

综合评估

共 2 项评测

评测名称 / 模式

得分

排名/总数

83.30

45 / 66

69.23

95 / 132

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

95.90

5 / 26

83.10

10 / 42

编程与软件工程

共 3 项评测

评测名称 / 模式

得分

排名/总数

88.40

14 / 39

84

8 / 28

51.20

92 / 123

与其他模型对比