Qwen3-235B-A22B-Thinking 评测详情

Qwen3-235B-A22B-Thinking 当前已收录的代表性评测结果包括 Creative Writing(5 / 23,得分 86.10)、MMLU Pro(34 / 126,得分 84.40)、AIME2025(33 / 106,得分 92.30)。

评测结果

Qwen3-235B-A22B-Thinking

评测结果

思考模式

综合评估

共 4 项评测
评测名称 / 模式
得分
排名/总数
84.40
34 / 126
81.10
68 / 179
LiveBench
开启思考
52.97
86 / 115
18.20
111 / 159

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
74.10
41 / 120

数学推理

共 3 项评测
评测名称 / 模式
得分
排名/总数
92.30
33 / 106
33.30
6 / 16

写作和创作

共 1 项评测
评测名称 / 模式
得分
排名/总数
86.10
5 / 23