Gemma 4 31BvsGLM-5

在 5 个共同 benchmark 中，GLM-5 整体领先：Gemma 4 31B 领先 0 项，GLM-5 领先 5 项，持平 0 项，平均分差 -9.83。

DeepMind · 2026-04-02 · 聊天大模型

智谱AI · 2026-02-11 · 聊天大模型

Gemma 4 31B0 项(0%)(100%)5 项GLM-5

评测分数

按能力类目分组，每组内按分差大小排列；共 5 项。

GLM-5 领先 3/3

评测项	Gemma 4 31B	GLM-5	分差
HLE	26.5097 / 172Thinking (With Tools + Internet)	50.4025 / 172	-23.90
LiveBench	61.6262 / 115Normal (No Tools)	68.8543 / 115Normal (No Tools)	-7.23
GPQA Diamond	84.3058 / 187Thinking (No Tools)	8648 / 187Thinking (No Tools)	-1.70

GLM-5 领先 1/1

评测项	Gemma 4 31B	GLM-5	分差
τ²-Bench	76.9020 / 43Thinking (With Tools)	89.704 / 43	-12.80

GLM-5 领先 1/1

评测项	Gemma 4 31B	GLM-5	分差
AIME 2026	89.2015 / 18Thinking (No Tools)	92.709 / 18Thinking (No Tools)	-3.50

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

部分模型公开价格不完整，缺失字段按"暂无公开价格"展示。

GLM-5在以下类目领先:General Knowledge (3/3)、Agent Level Benchmark (1/1)、Math and Reasoning (1/1)

5 个共同 benchmark 上，GLM-5 平均高出 9.83 分。

单项差距最大的 benchmark：HLE — Gemma 4 31B 26.50，GLM-5 50.40（分差 -23.90）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。