Gemma 4 31BvsGemma 3 - 27B (IT)

在 3 个共同 benchmark 中,Gemma 4 31B 整体领先:Gemma 4 31B 领先 3 项,Gemma 3 - 27B (IT) 领先 0 项,持平 0 项,平均分差 +36.63。

DeepMind
Gemma 4 31B

DeepMind · 2026-04-02 · 聊天大模型

Google Deep Mind
Gemma 3 - 27B (IT)

Google Deep Mind · 2025-03-12 · 聊天大模型

Gemma 4 31B3 (100%)(0%)0 Gemma 3 - 27B (IT)

评测分数

按能力类目分组,每组内按分差大小排列;共 3 项。

General Knowledge

Gemma 4 31B 领先 2/2
评测项Gemma 4 31BGemma 3 - 27B (IT)分差
GPQA Diamond84.3053 / 178Thinking (No Tools)42.40161 / 178Normal (No Tools)+41.90
MMLU Pro85.2023 / 126Thinking (No Tools)67.5096 / 126Normal (No Tools)+17.70

Coding and Software Engineer

Gemma 4 31B 领先 1/1
评测项Gemma 4 31BGemma 3 - 27B (IT)分差
LiveCodeBench8030 / 120Thinking (No Tools)29.70116 / 120Normal (No Tools)+50.30

规格对比

字段Gemma 4 31BGemma 3 - 27B (IT)
发布机构DeepMindGoogle Deep Mind
发布时间2026-04-022025-03-12
模型类型聊天大模型聊天大模型
架构稠密模型稠密模型
参数规模31亿270亿
上下文长度256K128K
最大输出32K暂无数据

小结

  • Gemma 4 31B在以下类目领先:General Knowledge (2/2)、Coding and Software Engineer (1/1)

3 个共同 benchmark 上,Gemma 4 31B 平均高出 36.63 分。

单项差距最大的 benchmark:LiveCodeBench — Gemma 4 31B 80,Gemma 3 - 27B (IT) 29.70(分差 +50.30)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。