MiniMax-M2.7vsMiniMax M2.5

在 9 个共同 benchmark 中,MiniMax-M2.7 整体领先:MiniMax-M2.7 领先 5 项,MiniMax M2.5 领先 4 项,持平 0 项,平均分差 +1.87。

MiniMaxAI
MiniMax-M2.7

MiniMaxAI · 2026-03-18 · 推理大模型

MiniMaxAI
MiniMax M2.5

MiniMaxAI · 2026-02-12 · 推理大模型

MiniMax-M2.75 (56%)(44%)4 MiniMax M2.5

评测分数

按能力类目分组,每组内按分差大小排列;共 9 项。

Claw-style Agent Evaluation

MiniMax M2.5 领先 2/2
评测项MiniMax-M2.7MiniMax M2.5分差
Pinch Bench87.109 / 37Thinking (With Tools)87.806 / 37Thinking (With Tools)-0.70
Claw Bench91.705 / 29Thinking (With Tools)92.104 / 29Thinking (With Tools)-0.40

General Knowledge

MiniMax-M2.7 领先 2/2
评测项MiniMax-M2.7MiniMax M2.5分差
HLE2882 / 157Thinking (No Tools)19.40106 / 157Thinking (No Tools)+8.60
GPQA Diamond8738 / 178Thinking (No Tools)85.2048 / 178Thinking (No Tools)+1.80

Agent Level Benchmark

MiniMax M2.5 领先 1/1
评测项MiniMax-M2.7MiniMax M2.5分差
τ²-Bench - Telecom8524 / 35Thinking (With Tools)97.8010 / 35-12.80

Coding and Software Engineer

MiniMax-M2.7 领先 1/1
评测项MiniMax-M2.7MiniMax M2.5分差
SWE-Bench Pro - Public56.2016 / 43Thinking (With Tools)55.4018 / 43+0.80

Instruction Following

MiniMax-M2.7 领先 1/1
评测项MiniMax-M2.7MiniMax M2.5分差
IF Bench765 / 29Thinking (With Tools)7012 / 29+6

Long Context

MiniMax M2.5 领先 1/1
评测项MiniMax-M2.7MiniMax M2.5分差
AA-LCR694 / 13Thinking (With Tools)69.503 / 13Thinking (No Tools)-0.50

Productivity Knowledge

MiniMax-M2.7 领先 1/1
评测项MiniMax-M2.7MiniMax M2.5分差
GDPval-AA5013 / 21Thinking (No Tools)3617 / 21Thinking (No Tools)+14

规格对比

字段MiniMax-M2.7MiniMax M2.5
发布机构MiniMaxAIMiniMaxAI
发布时间2026-03-182026-02-12
模型类型推理大模型推理大模型
架构MoE 架构MoE 架构
参数规模2290亿2290亿
上下文长度200K128K
最大输出200K暂无数据

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项MiniMax-M2.7MiniMax M2.5
文本输入$0.3 / 1M tokens$0.3 / 1M tokens
文本输出$1.2 / 1M tokens$2.4 / 1M tokens
缓存读取$0.06 / 1M tokens暂无公开价格
缓存写入$0.375 / 1M tokens暂无公开价格

小结

  • MiniMax-M2.7在以下类目领先:General Knowledge (2/2)、Coding and Software Engineer (1/1)、Instruction Following (1/1)、Productivity Knowledge (1/1)
  • MiniMax M2.5在以下类目领先:Claw-style Agent Evaluation (2/2)、Agent Level Benchmark (1/1)、Long Context (1/1)

9 个共同 benchmark 上,MiniMax-M2.7 平均高出 1.87 分。

单项差距最大的 benchmark:GDPval-AA — MiniMax-M2.7 50,MiniMax M2.5 36(分差 +14)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。