MiniMax M2.5vsM2.1

在 10 个共同 benchmark 中,MiniMax M2.5 整体领先:MiniMax M2.5 领先 8 项,M2.1 领先 1 项,持平 1 项,平均分差 +8.21。

MiniMaxAI
MiniMax M2.5

MiniMaxAI · 2026-02-12 · 推理大模型

MiniMaxAI
M2.1

MiniMaxAI · 2025-12-23 · 聊天大模型

MiniMax M2.58 (80%)持平1(10%)1 M2.1

评测分数

按能力类目分组,每组内按分差大小排列;共 10 项。

Coding and Software Engineer

MiniMax M2.5 领先 2/2
评测项MiniMax M2.5M2.1分差
SWE-Bench Pro - Public55.4018 / 4332.6042 / 43+22.80
SWE-bench Verified80.2013 / 10874.8035 / 108+5.40

General Knowledge

胶着 2/2
评测项MiniMax M2.5M2.1分差
GPQA Diamond85.2048 / 178Thinking (No Tools)8169 / 178+4.20
HLE19.40106 / 157Thinking (No Tools)2294 / 157-2.60

Agent Level Benchmark

MiniMax M2.5 领先 1/1
评测项MiniMax M2.5M2.1分差
τ²-Bench - Telecom97.8010 / 358722 / 35+10.80

AI Agent - Information Search

MiniMax M2.5 领先 1/1
评测项MiniMax M2.5M2.1分差
BrowseComp76.3018 / 4547.4037 / 45+28.90

AI Agent - Tool Usage

MiniMax M2.5 领先 1/1
评测项MiniMax M2.5M2.1分差
Terminal Bench 2.051.7030 / 4647.9035 / 46+3.80

Claw-style Agent Evaluation

MiniMax M2.5 领先 1/1
评测项MiniMax M2.5M2.1分差
Pinch Bench87.806 / 37Thinking (With Tools)84.3018 / 37Thinking (With Tools)+3.50

Instruction Following

胶着 1/1
评测项MiniMax M2.5M2.1分差
IF Bench7012 / 297012 / 29持平

Math and Reasoning

MiniMax M2.5 领先 1/1
评测项MiniMax M2.5M2.1分差
AIME202586.3048 / 106Thinking (No Tools)8156 / 106+5.30

规格对比

字段MiniMax M2.5M2.1
发布机构MiniMaxAIMiniMaxAI
发布时间2026-02-122025-12-23
模型类型推理大模型聊天大模型
架构MoE 架构MoE 架构
参数规模2290亿2300亿
上下文长度128K200K
最大输出暂无数据128K

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项MiniMax M2.5M2.1
文本输入$0.3 / 1M tokens暂无公开价格
文本输出$2.4 / 1M tokens暂无公开价格

部分模型公开价格不完整,缺失字段按"暂无公开价格"展示。

小结

  • MiniMax M2.5在以下类目领先:Coding and Software Engineer (2/2)、Agent Level Benchmark (1/1)、AI Agent - Information Search (1/1)、AI Agent - Tool Usage (1/1)、Claw-style Agent Evaluation (1/1)、Math and Reasoning (1/1)
  • 胶着类目:General Knowledge、Instruction Following

10 个共同 benchmark 上,MiniMax M2.5 平均高出 8.21 分。

单项差距最大的 benchmark:BrowseComp — MiniMax M2.5 76.30,M2.1 47.40(分差 +28.90)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。