GLM-5.2vsGLM-4.7

在 4 个共同 benchmark 中,GLM-5.2 整体领先:GLM-5.2 领先 4 项,GLM-4.7 领先 0 项,持平 0 项,平均分差 +11.30。

智谱AI
GLM-5.2

智谱AI · 2026-06-13 · 推理大模型

智谱AI
GLM-4.7

智谱AI · 2025-12-22 · 聊天大模型

GLM-5.24 (100%)(0%)0 GLM-4.7

评测分数

按能力类目分组,每组内按分差大小排列;共 4 项。

General Knowledge

GLM-5.2 领先 2/2
评测项GLM-5.2GLM-4.7分差
HLE54.708 / 159Thinking (With Tools)42.8042 / 159+11.90
GPQA Diamond91.2015 / 179Thinking (No Tools)85.7045 / 179+5.50

Coding and Software Engineer

GLM-5.2 领先 1/1
评测项GLM-5.2GLM-4.7分差
SWE-Bench Pro - Public62.105 / 44Thinking (With Tools)40.6040 / 44+21.50

Math and Reasoning

GLM-5.2 领先 1/1
评测项GLM-5.2GLM-4.7分差
AIME 202699.201 / 15Thinking (No Tools)92.907 / 15+6.30

规格对比

字段GLM-5.2GLM-4.7
发布机构智谱AI智谱AI
发布时间2026-06-132025-12-22
模型类型推理大模型聊天大模型
架构MoE 架构MoE 架构
参数规模7533.3亿3580亿
上下文长度1M200K
最大输出128K132072

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项GLM-5.2GLM-4.7
文本输入$1.4 / 1M tokens暂无公开价格
文本输出$4.4 / 1M tokens暂无公开价格
缓存读取$0.26 / 1M tokens暂无公开价格

部分模型公开价格不完整,缺失字段按"暂无公开价格"展示。

小结

  • GLM-5.2在以下类目领先:General Knowledge (2/2)、Coding and Software Engineer (1/1)、Math and Reasoning (1/1)

4 个共同 benchmark 上,GLM-5.2 平均高出 11.30 分。

单项差距最大的 benchmark:SWE-Bench Pro - Public — GLM-5.2 62.10,GLM-4.7 40.60(分差 +21.50)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。