MI

MiniMax M2

聊天大模型MiniMax MMiniMax M2

MiniMax-M2

发布时间: 2025-10-27更新于: 2025-10-27 17:43:133,000
模型参数
2300亿
上下文长度
205K
中文支持
支持
推理能力

MiniMax-M2 是由 MiniMaxAI 发布的 AI 模型,发布时间为 2025-10-27,定位为 聊天大模型,参数规模约为 2300亿,上下文长度为 205K,模型文件大小约 239.99 GB,采用 MIT License 许可,在 τ²-Bench - Telecom 上取得 87.00 分。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

MiniMax M2

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
205K tokens
最大输出长度
暂无数据
模型类型
聊天大模型
输入/输出模态
文本 → 文本
发布时间
2025-10-27
模型文件大小
239.99 GB
MoE架构
总参数 / 激活参数
2300亿 / 100亿
知识截止
暂无数据
MiniMax M2

开源和体验地址

代码开源状态
预训练权重开源
MIT License- 免费商用授权
MiniMax M2

官方介绍与博客

MiniMax M2

API接口信息

接口速度
3/5
暂无公开的 API 定价信息。
MiniMax M2

评测结果

MiniMax M2 当前已收录的代表性评测结果包括 LiveCodeBench(23 / 120,得分 83)、IF Bench(9 / 29,得分 72.30)、MMLU Pro(50 / 126,得分 82)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
82
50 / 126
78
84 / 179
12.50
129 / 161

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
83
23 / 120
69.40
58 / 108

数学推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
78
60 / 106

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
常规模式
25
54 / 63

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
77.20
18 / 40

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
72.30
9 / 29

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
44
40 / 46

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

MiniMax M2

发布机构

MiniMax-M2

模型解读

2025 年 10 月 27 日,中国 AI 公司 MiniMax 正式发布了其最新大语言模型 MiniMax M2,这款紧凑型模型专为编程任务和 Agentic 工作流设计,同时兼顾通用对话能力。 作为 MiniMax 在开源领域的又一力作,M2 的推出标志着国产大模型在效率和成本优化上的新进展,迅速登上全球评测榜单的前列。

模型概述:轻量级设计,聚焦高效智能体

MiniMax M2 并非一款追求参数规模的巨型模型,而是定位于“轻量级”架构,总参数量达 2300 亿,其中激活参数仅 100 亿。 这种设计理念源于对实际应用场景的考量,特别是可视化编程工具(如 MiniMax 的 Max 平台)和智能体工作流。不同于通用大模型的“全能型”定位,M2 更注重在特定任务中的深度优化,例如代码生成、代理式决策和多步推理,从而在资源受限的环境中实现高性能。

据官方描述,M2 支持长达 204,800 tokens 的上下文窗口,并可输出最多 131,072 tokens,这使得它在处理复杂编程项目或长链路 Agent 交互时表现出色。 此外,该模型已开源,开发者可以通过 MiniMax 的平台快速集成,标志着开源生态在 Agent 领域的进一步扩展。

关键特性:编程与 Agent 的“加速器”

M2 的核心亮点在于其针对编程和智能体优化的专项能力。首先,在代码生成与调试方面,模型能够高效处理多语言编程任务,支持从 Python 到 JavaScript 的广泛场景,并集成可视化编程接口。 这对于开发者构建自动化工作流尤为实用,例如在 DevOps 或低代码平台中的应用。

其次,作为 Agentic 工作流的专属引擎,M2 强调多代理协作和工具调用效率。它能模拟人类-like 的决策过程,减少幻觉发生率,并在实时交互中保持低延迟。 相比前代模型,M2 在这些领域的改进体现在更强的上下文保持和错误恢复机制上,帮助智能体在复杂环境中更可靠地执行任务。

通用对话能力也是 M2 的亮点之一,尽管非主打,但其在自然语言理解上的表现已接近顶级模型水准。

性能评测:直逼国际前沿,性价比突出

第三方评测显示,MiniMax M2 在 Artificial Analysis 榜单上位居前五,综合能力被认为“直逼 GPT-5”或“比肩 Claude 4.5”。 具体而言,它在代码基准(如 HumanEval)上的得分超越 DeepSeek-V3.2,在 Agent 任务(如 GAIA)中表现出色,推理速度和准确率均有显著提升。

定价方面,M2 采用亲民策略:每百万 tokens 输入 0.3 美元,输出 1.2 美元,仅为 Claude 系列的 8%。 这使得它在商业部署中更具竞争力,尤其适合中小企业或初创团队。API 已于发布当日上线,支持 OpenRouter 等平台集成。

潜在应用与展望

M2 的发布为 AI 智能体生态注入新活力。在编程教育、自动化测试和多模态 Agent 构建等领域,它有望成为关键工具。同时,开源性质将吸引全球开发者贡献,加速模型迭代。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码