GLM 5.1vsGLM-5

在 7 个共同 benchmark 中，GLM 5.1 整体领先：GLM 5.1 领先 7 项，GLM-5 领先 0 项，持平 0 项，平均分差 +1.88。

智谱AI · 2026-03-27 · 推理大模型

智谱AI · 2026-02-11 · 聊天大模型

GLM 5.17 项(100%)(0%)0 项GLM-5

评测分数

按能力类目分组，每组内按分差大小排列；共 7 项。

GLM 5.1 领先 3/3

评测项	GLM 5.1	GLM-5	分差
HLE	52.3019 / 172Thinking (With Tools)	50.4025 / 172	+1.90
LiveBench	70.1837 / 115Normal (No Tools)	68.8543 / 115Normal (No Tools)	+1.33
GPQA Diamond	86.2047 / 187Thinking (No Tools)	8648 / 187Thinking (No Tools)	+0.20

GLM 5.1 领先 2/2

评测项	GLM 5.1	GLM-5	分差
AIME 2026	95.304 / 18Thinking (No Tools)	92.709 / 18Thinking (No Tools)	+2.60
IMO-AnswerBench	83.8012 / 21Thinking (No Tools)	82.5015 / 21Thinking (No Tools)	+1.30

GLM 5.1 领先 1/1

评测项	GLM 5.1	GLM-5	分差
BrowseComp	79.3017 / 53Thinking (With Tools + Internet)	75.9024 / 53	+3.40

GLM 5.1 领先 1/1

评测项	GLM 5.1	GLM-5	分差
Terminal Bench 2.0	63.5013 / 47Thinking (With Tools)	61.1018 / 47	+2.40

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

GLM 5.1在以下类目领先:General Knowledge (3/3)、Math and Reasoning (2/2)、AI Agent - Information Search (1/1)、AI Agent - Tool Usage (1/1)

7 个共同 benchmark 上，GLM 5.1 平均高出 1.88 分。

单项差距最大的 benchmark：BrowseComp — GLM 5.1 79.30，GLM-5 75.90（分差 +3.40）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。