Qwen3-Max-Thinking 评测详情
Qwen3-Max-Thinking 当前已收录的代表性评测结果包括 LiveCodeBench(7 / 109,得分 85.90)、HLE(14 / 128,得分 49.80)、MMLU Pro(14 / 116,得分 85.70)。
评测结果
Qwen3-Max-Thinking
评测结果
综合评估
共 4 项评测评测名称 / 模式
得分
排名/总数
Qwen3-Max-Thinking 当前已收录的代表性评测结果包括 LiveCodeBench(7 / 109,得分 85.90)、HLE(14 / 128,得分 49.80)、MMLU Pro(14 / 116,得分 85.70)。