Kimi K2.6vsGLM 5.1

在 10 个共同 benchmark 中，Kimi K2.6 整体领先：Kimi K2.6 领先 9 项，GLM 5.1 领先 1 项，持平 0 项，平均分差 +2.27。

Moonshot AI · 2026-04-20 · 推理大模型

智谱AI · 2026-03-27 · 推理大模型

Kimi K2.69 项(90%)(10%)1 项GLM 5.1

评测分数

按能力类目分组，每组内按分差大小排列；共 10 项。

Kimi K2.6 领先 2/3

评测项	Kimi K2.6	GLM 5.1	分差
Tool Decathlon	502 / 9Thinking (With Tools)	40.705 / 9Thinking (With Tools)	+9.30
TerminalBench 2.1	53.5627 / 27Thinking (No Tools)	58.7024 / 27Thinking High (With Tools)	-5.14
Terminal Bench 2.0	66.7010 / 47Thinking (With Tools)	63.5013 / 47Thinking (With Tools)	+3.20

Kimi K2.6 领先 3/3

评测项	Kimi K2.6	GLM 5.1	分差
GPQA Diamond	90.5018 / 187Thinking (No Tools)	86.2047 / 187Thinking (No Tools)	+4.30
LiveBench	72.1728 / 115Thinking (No Tools)	70.1837 / 115Normal (No Tools)	+1.99
HLE	5415 / 172Thinking (With Tools + Internet)	52.3019 / 172Thinking (With Tools)	+1.70

Kimi K2.6 领先 2/2

评测项	Kimi K2.6	GLM 5.1	分差
IMO-AnswerBench	868 / 21Thinking (No Tools)	83.8012 / 21Thinking (No Tools)	+2.20
AIME 2026	96.403 / 18Thinking (No Tools)	95.304 / 18Thinking (No Tools)	+1.10

Kimi K2.6 领先 1/1

评测项	Kimi K2.6	GLM 5.1	分差
BrowseComp	83.2014 / 53Thinking (With Tools + Internet)	79.3017 / 53Thinking (With Tools + Internet)	+3.90

Kimi K2.6 领先 1/1

评测项	Kimi K2.6	GLM 5.1	分差
SWE-Bench Pro - Public	58.6013 / 54Thinking (With Tools)	58.4015 / 54Thinking (With Tools)	+0.20

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

Kimi K2.6在以下类目领先:AI Agent - Tool Usage (2/3)、General Knowledge (3/3)、Math and Reasoning (2/2)、AI Agent - Information Search (1/1)、Coding and Software Engineer (1/1)

10 个共同 benchmark 上，Kimi K2.6 平均高出 2.27 分。

单项差距最大的 benchmark：Tool Decathlon — Kimi K2.6 50，GLM 5.1 40.70（分差 +9.30）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。