MiniMax-M2.7vsKimi K2.5

在 7 个共同 benchmark 中,MiniMax-M2.7 整体领先:MiniMax-M2.7 领先 5 项,Kimi K2.5 领先 2 项,持平 0 项,平均分差 +1.29。

MiniMaxAI
MiniMax-M2.7

MiniMaxAI · 2026-03-18 · 推理大模型

Moonshot AI
Kimi K2.5

Moonshot AI · 2026-01-27 · 多模态大模型

MiniMax-M2.75 (71%)(29%)2 Kimi K2.5

评测分数

按能力类目分组,每组内按分差大小排列;共 7 项。

Claw-style Agent Evaluation

MiniMax-M2.7 领先 2/2
评测项MiniMax-M2.7Kimi K2.5分差
Claw Bench91.705 / 29Thinking (With Tools)81.7018 / 29Thinking (With Tools)+10
Pinch Bench87.109 / 37Thinking (With Tools)84.8017 / 37Thinking (With Tools)+2.30

General Knowledge

Kimi K2.5 领先 2/2
评测项MiniMax-M2.7Kimi K2.5分差
HLE2882 / 157Thinking (No Tools)50.2020 / 157Thinking (With Tools)-22.20
GPQA Diamond8738 / 178Thinking (No Tools)87.6034 / 178Thinking (No Tools)-0.60

Coding and Software Engineer

MiniMax-M2.7 领先 1/1
评测项MiniMax-M2.7Kimi K2.5分差
SWE-Bench Pro - Public56.2016 / 43Thinking (With Tools)50.7031 / 43Thinking (With Tools)+5.50

Long Context

MiniMax-M2.7 领先 1/1
评测项MiniMax-M2.7Kimi K2.5分差
AA-LCR694 / 13Thinking (With Tools)6510 / 13Thinking (No Tools)+4

Productivity Knowledge

MiniMax-M2.7 领先 1/1
评测项MiniMax-M2.7Kimi K2.5分差
GDPval-AA5013 / 21Thinking (No Tools)4015 / 21Thinking (No Tools)+10

规格对比

字段MiniMax-M2.7Kimi K2.5
发布机构MiniMaxAIMoonshot AI
发布时间2026-03-182026-01-27
模型类型推理大模型多模态大模型
架构MoE 架构MoE 架构
参数规模2290亿1万亿
上下文长度200K256K
最大输出200K16K

API 调用价格

价格优先使用 DataLearner 配置的 API 记录;缺失项不做推测。

价格项MiniMax-M2.7Kimi K2.5
文本输入$0.3 / 1M tokens暂无公开价格
文本输出$1.2 / 1M tokens暂无公开价格
缓存读取$0.06 / 1M tokens暂无公开价格
缓存写入$0.375 / 1M tokens暂无公开价格

部分模型公开价格不完整,缺失字段按"暂无公开价格"展示。

小结

  • MiniMax-M2.7在以下类目领先:Claw-style Agent Evaluation (2/2)、Coding and Software Engineer (1/1)、Long Context (1/1)、Productivity Knowledge (1/1)
  • Kimi K2.5在以下类目领先:General Knowledge (2/2)

7 个共同 benchmark 上,MiniMax-M2.7 平均高出 1.29 分。

单项差距最大的 benchmark:HLE — MiniMax-M2.7 28,Kimi K2.5 50.20(分差 -22.20)。

本页正文由结构化模型、价格与 benchmark 数据生成,不使用实时 LLM 撰写。