MiniMax M2.5vsM2.1

在 10 个共同 benchmark 中，MiniMax M2.5 整体领先：MiniMax M2.5 领先 8 项，M2.1 领先 1 项，持平 1 项，平均分差 +8.21。

MiniMaxAI · 2026-02-12 · 推理大模型

MiniMaxAI · 2025-12-23 · 聊天大模型

MiniMax M2.58 项(80%)持平1(10%)1 项M2.1

评测分数

按能力类目分组，每组内按分差大小排列；共 10 项。

MiniMax M2.5 领先 2/2

评测项	MiniMax M2.5	M2.1	分差
SWE-Bench Pro - Public	55.4018 / 43	32.6042 / 43	+22.80
SWE-bench Verified	80.2013 / 108	74.8035 / 108	+5.40

胶着 2/2

评测项	MiniMax M2.5	M2.1	分差
GPQA Diamond	85.2048 / 178Thinking (No Tools)	8169 / 178	+4.20
HLE	19.40106 / 157Thinking (No Tools)	2294 / 157	-2.60

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	M2.1	分差
τ²-Bench - Telecom	97.8010 / 35	8722 / 35	+10.80

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	M2.1	分差
BrowseComp	76.3018 / 45	47.4037 / 45	+28.90

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	M2.1	分差
Terminal Bench 2.0	51.7030 / 46	47.9035 / 46	+3.80

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	M2.1	分差
Pinch Bench	87.806 / 37Thinking (With Tools)	84.3018 / 37Thinking (With Tools)	+3.50

胶着 1/1

评测项	MiniMax M2.5	M2.1	分差
IF Bench	7012 / 29	7012 / 29	持平

MiniMax M2.5 领先 1/1

评测项	MiniMax M2.5	M2.1	分差
AIME2025	86.3048 / 106Thinking (No Tools)	8156 / 106	+5.30

价格优先使用 DataLearner 配置的 API 记录；缺失项不做推测。

价格项	MiniMax M2.5	M2.1
文本输入	$0.3 / 1M tokens	暂无公开价格
文本输出	$2.4 / 1M tokens	暂无公开价格

部分模型公开价格不完整，缺失字段按"暂无公开价格"展示。

MiniMax M2.5在以下类目领先:Coding and Software Engineer (2/2)、Agent Level Benchmark (1/1)、AI Agent - Information Search (1/1)、AI Agent - Tool Usage (1/1)、Claw-style Agent Evaluation (1/1)、Math and Reasoning (1/1)
胶着类目:General Knowledge、Instruction Following

10 个共同 benchmark 上，MiniMax M2.5 平均高出 8.21 分。

单项差距最大的 benchmark：BrowseComp — MiniMax M2.5 76.30，M2.1 47.40（分差 +28.90）。

本页正文由结构化模型、价格与 benchmark 数据生成，不使用实时 LLM 撰写。