GLM-5.2vsGLM-5

在 4 个共同 benchmark 中，GLM-5.2 整体领先：GLM-5.2 领先 4 项，GLM-5 领先 0 项，持平 0 项，平均分差 +6.12。

智谱AI · 2026-06-13 · 推理大模型

智谱AI · 2026-02-11 · 聊天大模型

GLM-5.24 项(100%)(0%)0 项GLM-5

评测分数

按能力类目分组，每组内按分差大小排列；共 4 项。

GLM-5.2 领先 2/2

评测项	GLM-5.2	GLM-5	分差
GPQA Diamond	91.2015 / 179Thinking (No Tools)	8644 / 179Thinking (No Tools)	+5.20
HLE	54.708 / 159Thinking (With Tools)	50.4019 / 159	+4.30

GLM-5.2 领先 2/2

评测项	GLM-5.2	GLM-5	分差
IMO-AnswerBench	911 / 20Thinking (No Tools)	82.5014 / 20Thinking (No Tools)	+8.50
AIME 2026	99.201 / 15Thinking (No Tools)	92.708 / 15Thinking (No Tools)	+6.50

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

4 个共同 benchmark 上，GLM-5.2 平均高出 6.12 分。

单项差距最大的 benchmark：IMO-AnswerBench — GLM-5.2 91，GLM-5 82.50（分差 +8.50）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。