Qwen3.6-35B-A3B 评测详情

Qwen3.6-35B-A3B 当前已收录的代表性评测结果包括 GPQA（1 / 15，得分 86）、MMLU Pro（24 / 132，得分 85.20）、LiveCodeBench（28 / 123，得分 80.40）。

评测结果

Qwen3.6-35B-A3B

评测结果

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

开启思考

90

7 / 10

开启思考

86

1 / 15

开启思考

85.20

24 / 132

开启思考

21.40

112 / 170

编程与软件工程

共 4 项评测

评测名称 / 模式

得分

排名/总数

开启思考

80.40

28 / 123

SWE-bench Verified

开启思考

73.40

46 / 111

SWE-bench Multilingual

开启思考

67.20

20 / 22

SWE-Bench Pro - Public

开启思考

49.50

40 / 51

AI Agent - 工具使用

共 2 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

开启思考

51.50

32 / 47

开启思考

26.90

9 / 9

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

开启思考

92.70

9 / 18

IMO-AnswerBench

开启思考

78.90

19 / 21

与其他模型对比