Qwen 3.6 Plus PreviewvsGLM 5.1

在 8 个共同 benchmark 中，GLM 5.1 整体领先：Qwen 3.6 Plus Preview 领先 2 项，GLM 5.1 领先 4 项，持平 2 项，平均分差 -0.18。

阿里巴巴 · 2026-03-31 · 聊天大模型

智谱AI · 2026-03-27 · 推理大模型

Qwen 3.6 Plus Preview2 项(25%)持平2(50%)4 项GLM 5.1

评测分数

按能力类目分组，每组内按分差大小排列；共 8 项。

Qwen 3.6 Plus Preview 领先 2/3

评测项	Qwen 3.6 Plus Preview	GLM 5.1	分差
GPQA Diamond	90.4019 / 187Thinking (No Tools)	86.2047 / 187Thinking (No Tools)	+4.20
HLE	50.6024 / 172Thinking (With Tools)	52.3019 / 172Thinking (With Tools)	-1.70
LiveBench	70.8534 / 115Normal (No Tools)	70.1837 / 115Normal (No Tools)	+0.67

GLM 5.1 领先 2/2

评测项	Qwen 3.6 Plus Preview	GLM 5.1	分差
Terminal Bench 2.0	61.6016 / 47Thinking (With Tools)	63.5013 / 47Thinking (With Tools)	-1.90
Tool Decathlon	39.806 / 9Thinking (With Tools)	40.705 / 9Thinking (With Tools)	-0.90

胶着 2/2

评测项	Qwen 3.6 Plus Preview	GLM 5.1	分差
AIME 2026	95.304 / 18Thinking (No Tools)	95.304 / 18Thinking (No Tools)	持平
IMO-AnswerBench	83.8012 / 21Thinking (No Tools)	83.8012 / 21Thinking (No Tools)	持平

GLM 5.1 领先 1/1

评测项	Qwen 3.6 Plus Preview	GLM 5.1	分差
SWE-Bench Pro - Public	56.6020 / 54Thinking (With Tools)	58.4015 / 54Thinking (With Tools)	-1.80

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

8 个共同 benchmark 上，GLM 5.1 平均高出 0.18 分。

单项差距最大的 benchmark：GPQA Diamond — Qwen 3.6 Plus Preview 90.40，GLM 5.1 86.20（分差 +4.20）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。