MiniMax M2.5vsMiniMax M2

在 7 个共同 benchmark 中，MiniMax M2.5 整体领先：MiniMax M2.5 领先 6 项，MiniMax M2 领先 1 项，持平 0 项，平均分差 +10.57。

MiniMaxAI · 2026-02-12 · 推理大模型

MiniMaxAI · 2025-10-27 · 聊天大模型

MiniMax M2.56 项(86%)(14%)1 项MiniMax M2

评测分数

按能力类目分组，每组内按分差大小排列；共 7 项。

MiniMax M2.5 领先 2/2

评测项	MiniMax M2.5	MiniMax M2	分差
GPQA Diamond	85.2053 / 187Thinking (No Tools)	7889 / 187	+7.20
HLE	19.40121 / 172Thinking (No Tools)	12.50140 / 172	+6.90

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	MiniMax M2	分差
τ²-Bench - Telecom	97.8010 / 35	8722 / 35	+10.80

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	MiniMax M2	分差
BrowseComp	76.3023 / 53	4446 / 53	+32.30

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	MiniMax M2	分差
SWE-bench Verified	80.2014 / 112	69.4062 / 112	+10.80

MiniMax M2 领先 1/1

评测项	MiniMax M2.5	MiniMax M2	分差
IF Bench	7013 / 30	72.3010 / 30	-2.30

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	MiniMax M2	分差
AIME2025	86.3049 / 107Thinking (No Tools)	7861 / 107	+8.30

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

MiniMax M2.5在以下类目领先:General Knowledge (2/2)、Agent Level Benchmark (1/1)、AI Agent - Information Search (1/1)、Coding and Software Engineer (1/1)、Math and Reasoning (1/1)
MiniMax M2在以下类目领先:Instruction Following (1/1)

7 个共同 benchmark 上，MiniMax M2.5 平均高出 10.57 分。

单项差距最大的 benchmark：BrowseComp — MiniMax M2.5 76.30，MiniMax M2 44（分差 +32.30）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。