MiniMax-M2.7vsKimi K2.5

在 8 个共同 benchmark 中，MiniMax-M2.7 整体领先：MiniMax-M2.7 领先 5 项，Kimi K2.5 领先 3 项，持平 0 项，平均分差 +0.43。

MiniMaxAI · 2026-03-18 · 推理大模型

Moonshot AI · 2026-01-27 · 多模态大模型

MiniMax-M2.75 项(63%)(38%)3 项Kimi K2.5

评测分数

按能力类目分组，每组内按分差大小排列；共 8 项。

Kimi K2.5 领先 3/3

评测项	MiniMax-M2.7	Kimi K2.5	分差
HLE	2896 / 172Thinking (No Tools)	50.2027 / 172Thinking (With Tools)	-22.20
LiveBench	63.4956 / 115Deep Thinking (No Tools)	69.0742 / 115Thinking (No Tools)	-5.58
GPQA Diamond	8742 / 187Thinking (No Tools)	87.6037 / 187Thinking (No Tools)	-0.60

MiniMax-M2.7 领先 2/2

评测项	MiniMax-M2.7	Kimi K2.5	分差
Claw Bench	91.705 / 29Thinking (With Tools)	81.7018 / 29Thinking (With Tools)	+10
Pinch Bench	87.109 / 37Thinking (With Tools)	84.8017 / 37Thinking (With Tools)	+2.30

MiniMax-M2.7 领先 1/1

评测项	MiniMax-M2.7	Kimi K2.5	分差
SWE-Bench Pro - Public	56.2024 / 54Thinking (With Tools)	50.7041 / 54Thinking (With Tools)	+5.50

MiniMax-M2.7 领先 1/1

评测项	MiniMax-M2.7	Kimi K2.5	分差
AA-LCR	696 / 15Thinking (With Tools)	6512 / 15Thinking (No Tools)	+4

MiniMax-M2.7 领先 1/1

评测项	MiniMax-M2.7	Kimi K2.5	分差
GDPval-AA	5013 / 21Thinking (No Tools)	4015 / 21Thinking (No Tools)	+10

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

MiniMax-M2.7在以下类目领先:Claw-style Agent Evaluation (2/2)、Coding and Software Engineer (1/1)、Long Context (1/1)、Productivity Knowledge (1/1)
Kimi K2.5在以下类目领先:General Knowledge (3/3)

8 个共同 benchmark 上，MiniMax-M2.7 平均高出 0.43 分。

单项差距最大的 benchmark：HLE — MiniMax-M2.7 28，Kimi K2.5 50.20（分差 -22.20）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。