Qwen3-32B 评测详情

Qwen3-32B 当前已收录的代表性评测结果包括 MATH-500（14 / 44，得分 97.20）、AIME 2024（25 / 62，得分 81.40）、LiveCodeBench（61 / 120，得分 65.70）。

评测结果

Qwen3-32B

评测结果

综合评估

共 5 项评测

评测名称 / 模式

得分

排名/总数

常规模式

83.30

9 / 9

开启思考

87.30

8 / 9

常规模式

54.60

152 / 182

开启思考

68.40

123 / 182

开启思考

43.56

105 / 115

数学推理

共 6 项评测

评测名称 / 模式

得分

排名/总数

常规模式

88.60

38 / 44

开启思考

97.20

14 / 44

常规模式

31

55 / 62

开启思考

81.40

25 / 62

常规模式

20.20

105 / 106

开启思考

72.90

69 / 106

编程与软件工程

共 4 项评测

评测名称 / 模式

得分

排名/总数

常规模式

1353

16 / 16

开启思考

1977

14 / 16

常规模式

31.30

114 / 120

开启思考

65.70

61 / 120

写作和创作

共 2 项评测

评测名称 / 模式

得分

排名/总数

Creative Writing

常规模式

78.30

19 / 23

Creative Writing

开启思考

81

17 / 23

Agent能力评测

共 1 项评测

评测名称 / 模式

得分

排名/总数

常规模式

40

39 / 59

与其他模型对比