MiniMax M2.7 发布:模型开始帮自己训练自己
MiniMaxAI 刚刚发布了全新的 M2.7 模型,官方说本次发布的 M2.7 最大的特点是第一个深度参与迭代自身训练流程的模型,也就是说模型在训练过程中进行了自我分析并参与迭代。M2.7 已经可以在官网使用,接口价格不变。不过该模型当前并未宣布开源,还不确定未来情况。

关于 M2.7 开源情况、详细评测和其它模型对比,大家也可以关注 DataLearnerAI 的 MiniMax M2.7 模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/minimax-m2-7
其实 M2.7 在正式发布前两天就已经在社区里传开了。3 月 16 日,有人在 X 上发现了它短暂出现在官方文档和 DesignArena 评测平台上,随后被迅速撤下,今天是正式官宣。
M2.7 模型自己帮助自己训练
这次发布最有意思的部分是 MiniMax 让 M2.7 参与了自身的训练过程。具体来说,他们用 M2.7 构建了强化学习训练流程里的数十个复杂 Skills,让模型负责监控实验、排查日志、修复代码、跑评测——研究员只在需要做关键决策的时候才介入。在这套流程下,M2.7 能承担整个研发工作流里大约 30–50% 的工作量。
他们还做了一个更具体的测试:让 M2.7 自主优化内部的软件工程脚手架,模型自己跑了超过 100 轮「分析失败 → 规划改动 → 修代码 → 跑评测 → 看结果 → 决定留还是回退」的循环,最终在内部评测上提升了 30%。
为了测模型自主优化能力的上限,MiniMax 还参加了 MLE Bench Lite 的测试,一共 22 个机器学习任务,每次给 24 小时自主迭代。三次测试平均得牌率 66.6%,最好的一次拿了 9 金 5 银 1 铜。给出的对比数据是:Claude Opus 4.6(75.7%)、GPT-5.4(71.2%)、Gemini 3.1(66.6%)。也就是说,这水平和 Gemini 3.1 Pro 差不多了。

