DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
Tools

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表MiniMax-M2.7
MI

MiniMax-M2.7

MiniMax-M2.7

发布时间: 2026-03-18更新于: 2026-03-18 16:49:58.415599
在线体验GitHubHugging FaceCompare
模型参数
2300.0亿
上下文长度
200K
中文支持
支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

MiniMax-M2.7

模型基本信息

推理过程
支持
思考模式
思考水平 · 开启 (On) (默认)思考水平 · 关闭 (Off)
上下文长度
200K tokens
最大输出长度
204800 tokens
模型类型
推理大模型
发布时间
2026-03-18
模型文件大小
未知
MoE架构
是
总参数 / 激活参数
2300.0 亿 / 100 亿
知识截止
暂无数据
MiniMax-M2.7

开源和体验地址

代码开源状态
不开源
预训练权重开源
不开源- 不开源
GitHub 源码
暂无GitHub开源地址
Hugging Face
暂无开源HuggingFace地址
在线体验
https://agent.minimax.io/
MiniMax-M2.7

官方介绍与博客

官方论文
MiniMax M2.7: Early Echoes of Self-Evolution
DataLearnerAI博客
MiniMax M2.7 发布:模型开始帮自己训练自己
MiniMax-M2.7

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
了解不同定价模式详解
标准模式
类型适用条件输入输出
文本-$0.300/ 1M$1.20/ 1M
缓存定价Prompt缓存
类型有效期写入读取
文本5m$0.375/ 1M$0.060/ 1M
MiniMax-M2.7

评测结果

思考模式
思考模式细分 (1)
工具使用

编程与软件工程

共 1 项评测
评测名称 / 模式
得分
排名/总数
SWE-Bench Pro - Public
开启使用工具
56.20
3 / 19

生产力知识

共 1 项评测
评测名称 / 模式
得分
排名/总数
GDPval-AA
开启
50
7 / 15
查看评测深度分析与其他模型对比
MiniMax-M2.7

发布机构

MiniMaxAI
MiniMaxAI
查看发布机构详情
MiniMax-M2.7

模型解读

M2.7是MiniMaxAI在2026年3月18日发布的模型,也是业内首个深度参与自身训练流程的大语言模型。与以往模型不同,M2.7在训练过程中主动承担了强化学习流程中数十个复杂任务的构建,包括监控实验、排查日志、修复代码和运行评测,研究员仅在需要做关键决策时介入。官方数据显示,M2.7能承担整个研发工作流约30–50%的工作量。


核心亮点:模型参与自身训练

M2.7最大的技术特点在于”模型训练模型”的闭环机制。MiniMax让M2.7在训练过程中自主优化内部的软件工程脚手架,模型自主执行了超过100轮完整的迭代循环,流程涵盖:

  • 分析失败原因
  • 规划代码改动
  • 修复并提交代码
  • 运行评测
  • 查看结果
  • 决定保留或回退

最终在内部评测中实现了30%的性能提升。这套机制使M2.7成为目前少数真正参与过自身训练迭代的商用大模型之一。


评测表现

根据官方公布的数据,M2.7在多项基准测试中相较上代M2.5均有明显提升,部分指标已接近同期顶级闭源模型水平。Artificial Analysis大模型智力指数从42分提升至50分,涨幅约20%。

评测基准M2.7M2.5Gemini 3.1 ProSonnet 4.6Opus 4.6GPT 5.4
SWE Bench Pro56.255.454.257.257.357.7
Multi-SWE Bench52.751.3—51.050.349.0
VIBE-Pro55.654.241.056.155.6—
MLE-Bench Lite66.651.566.672.775.771.2
GDPval-AA503541575558
Toolathlon46.338.348.844.847.254.6
MM-ClawBench62.757.661.864.275.473.6
Artificial Analysis504257525357

在MLE-Bench Lite(22个机器学习任务,每次24小时自主迭代)中,M2.7三次测试平均得牌率66.6%,最佳成绩为9金5银1铜,与Gemini 3.1 Pro持平。


软件工程能力

官方重点强调了M2.7在真实生产环境中的工程能力。在内部案例中,M2.7面对线上告警时可自主完成以下流程:

  1. 分析监控指标与部署时间线
  2. 连接数据库验证根本原因
  3. 优先采用非阻塞方式建索引进行止血处理
  4. 提交代码合并请求

据官方介绍,基于M2.7已多次将线上故障恢复时间压缩至三分钟以内。需注意,上述案例均为内部数据,尚无独立第三方复现。


新功能:原生 Agent Teams 支持

M2.7新增了原生的Agent Teams多智能体协作能力,支持多个AI智能体分工合作完成复杂任务。官方认为,这种能力必须内化到模型本身,单纯依靠提示词工程无法实现稳定的多智能体协作。


办公与娱乐场景

除软件工程外,M2.7在办公和娱乐场景也有所强化:

  • 金融文档分析:可读取年报和业绩会纪要,交叉对比多篇研报,自动建立营收预测模型,输出PPT、Word和Excel图表。据参与评估的金融从业者反馈,产出物可直接用作初稿。
  • 角色扮演与人设保持:强化了对话中的人设一致性,旨在将Agentic模型的使用场景从生产力工具延伸至互动娱乐。
  • OpenRoom 开源项目:MiniMax配套发布了开源原型项目OpenRoom,是一个Web界面的AI互动空间,AI角色可与场景实时互动并产生视觉反馈,可在 openroom.ai 直接体验。该项目大部分代码由AI编写,目前仍处于原型阶段。

发布信息与注意事项

  • 发布时间:2026年3月18日正式官宣(3月16日曾短暂出现在官方文档和DesignArena评测平台)
  • 接口价格:与上代M2.5保持一致,无调整
  • 开源状态:目前未宣布开源,未来情况不明
  • 可用性:已全量上线,可通过官网及API直接使用

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码