GLM-5.2vsGLM 5.1

在 6 个共同 benchmark 中,GLM-5.2 整体领先:GLM-5.2 领先 6 项,GLM 5.1 领先 0 项,持平 0 项,平均分差 +7.42。

智谱AI
GLM-5.2

智谱AI · 2026-06-13 · 推理大模型

智谱AI
GLM 5.1

智谱AI · 2026-03-27 · 推理大模型

GLM-5.26 (100%)(0%)0 GLM 5.1

评测分数

按能力类目分组,每组内按分差大小排列;共 6 项。

General Knowledge

GLM-5.2 领先 2/2
评测项GLM-5.2GLM 5.1分差
GPQA Diamond91.2015 / 179Thinking (No Tools)86.2043 / 179Thinking (No Tools)+5
HLE54.708 / 159Thinking (With Tools)52.3013 / 159Thinking (With Tools)+2.40

Math and Reasoning

GLM-5.2 领先 2/2
评测项GLM-5.2GLM 5.1分差
IMO-AnswerBench911 / 20Thinking (No Tools)83.8011 / 20Thinking (No Tools)+7.20
AIME 202699.201 / 15Thinking (No Tools)95.303 / 15Thinking (No Tools)+3.90

AI Agent - Tool Usage

GLM-5.2 领先 1/1
评测项GLM-5.2GLM 5.1分差
TerminalBench 2.1814 / 14Thinking High (With Tools)58.7012 / 14Thinking High (With Tools)+22.30

Coding and Software Engineer

GLM-5.2 领先 1/1
评测项GLM-5.2GLM 5.1分差
SWE-Bench Pro - Public62.105 / 44Thinking (With Tools)58.4010 / 44Thinking (With Tools)+3.70

规格对比

字段GLM-5.2GLM 5.1
发布机构智谱AI智谱AI
发布时间2026-06-132026-03-27
模型类型推理大模型推理大模型
架构MoE 架构MoE 架构
参数规模7533.3亿754亿
上下文长度1M200K
最大输出128K125K

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项GLM-5.2GLM 5.1
文本输入$1.4 / 1M tokens$1.4 / 1M tokens
文本输出$4.4 / 1M tokens$4.4 / 1M tokens
缓存读取$0.26 / 1M tokens$4.4 / 1M tokens
缓存写入暂无公开价格$0.26 / 1M tokens

小结

  • GLM-5.2在以下类目领先:General Knowledge (2/2)、Math and Reasoning (2/2)、AI Agent - Tool Usage (1/1)、Coding and Software Engineer (1/1)

6 个共同 benchmark 上,GLM-5.2 平均高出 7.42 分。

单项差距最大的 benchmark:TerminalBench 2.1 — GLM-5.2 81,GLM 5.1 58.70(分差 +22.30)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。