MiniMax-M2.7vsMiniMax M2.5

在 10 个共同 benchmark 中，MiniMax-M2.7 整体领先：MiniMax-M2.7 领先 6 项，MiniMax M2.5 领先 4 项，持平 0 项，平均分差 +2.01。

MiniMaxAI · 2026-03-18 · 推理大模型

MiniMaxAI · 2026-02-12 · 推理大模型

MiniMax-M2.76 项(60%)(40%)4 项MiniMax M2.5

评测分数

按能力类目分组，每组内按分差大小排列；共 10 项。

MiniMax-M2.7 领先 3/3

评测项	MiniMax-M2.7	MiniMax M2.5	分差
HLE	2896 / 172Thinking (No Tools)	19.40121 / 172Thinking (No Tools)	+8.60
LiveBench	63.4956 / 115Deep Thinking (No Tools)	60.1468 / 115Deep Thinking (No Tools)	+3.35
GPQA Diamond	8742 / 187Thinking (No Tools)	85.2053 / 187Thinking (No Tools)	+1.80

MiniMax M2.5 领先 2/2

评测项	MiniMax-M2.7	MiniMax M2.5	分差
Pinch Bench	87.109 / 37Thinking (With Tools)	87.806 / 37Thinking (With Tools)	-0.70
Claw Bench	91.705 / 29Thinking (With Tools)	92.104 / 29Thinking (With Tools)	-0.40

MiniMax M2.5 领先 1/1

评测项	MiniMax-M2.7	MiniMax M2.5	分差
τ²-Bench - Telecom	8524 / 35Thinking (With Tools)	97.8010 / 35	-12.80

MiniMax-M2.7 领先 1/1

评测项	MiniMax-M2.7	MiniMax M2.5	分差
SWE-Bench Pro - Public	56.2024 / 54Thinking (With Tools)	55.4026 / 54	+0.80

MiniMax-M2.7 领先 1/1

评测项	MiniMax-M2.7	MiniMax M2.5	分差
IF Bench	766 / 30Thinking (With Tools)	7013 / 30	+6

MiniMax M2.5 领先 1/1

评测项	MiniMax-M2.7	MiniMax M2.5	分差
AA-LCR	696 / 15Thinking (With Tools)	69.505 / 15Thinking (No Tools)	-0.50

MiniMax-M2.7 领先 1/1

评测项	MiniMax-M2.7	MiniMax M2.5	分差
GDPval-AA	5013 / 21Thinking (No Tools)	3617 / 21Thinking (No Tools)	+14

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

MiniMax-M2.7在以下类目领先:General Knowledge (3/3)、Coding and Software Engineer (1/1)、Instruction Following (1/1)、Productivity Knowledge (1/1)
MiniMax M2.5在以下类目领先:Claw-style Agent Evaluation (2/2)、Agent Level Benchmark (1/1)、Long Context (1/1)

10 个共同 benchmark 上，MiniMax-M2.7 平均高出 2.01 分。

单项差距最大的 benchmark：GDPval-AA — MiniMax-M2.7 50，MiniMax M2.5 36（分差 +14）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。