MiniMax M2

Name: MiniMax-M2
Author: MiniMaxAI

聊天大模型MiniMax MMiniMax M2

MiniMax-M2

发布时间: 2025-10-27更新于: 2025-10-27 17:43:133,000

在线体验 GitHub Hugging Face Compare

模型参数

2300亿

上下文长度

205K

中文支持

支持

推理能力

MiniMax-M2 是由 MiniMaxAI 发布的 AI 模型，发布时间为 2025-10-27，定位为聊天大模型，参数规模约为 2300亿，上下文长度为 205K，模型文件大小约 239.99 GB，采用 MIT License 许可，在 τ²-Bench - Telecom 上取得 87.00 分。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

MiniMax M2

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

205K tokens

最大输出长度

暂无数据

模型类型

聊天大模型

输入/输出模态

文本 → 文本

发布时间

2025-10-27

模型文件大小

239.99 GB

MoE架构

是

总参数 / 激活参数

2300亿 / 100亿

知识截止

暂无数据

MiniMax M2

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MIT License- 免费商用授权

GitHub 源码

https://github.com/MiniMax-AI/MiniMax-M2

Hugging Face

https://huggingface.co/MiniMaxAI/MiniMax-M2

在线体验

https://agent.minimax.io/

MiniMax M2

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

MiniMaxAI开源MiniMax M2模型：Artificial Analysis评测显示综合智能得分超过Claude Opus 4.1，开源第一，全球第五。

MiniMax M2

API接口信息

接口速度

3/5

暂无公开的 API 定价信息。

MiniMax M2

评测结果

MiniMax M2 当前已收录的代表性评测结果包括 LiveCodeBench（23 / 120，得分 83）、IF Bench（9 / 29，得分 72.30）、MMLU Pro（50 / 126，得分 82）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总数

MMLU Pro

50 / 126

GPQA Diamond

84 / 179

HLE

12.50

129 / 161

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

23 / 120

SWE-bench Verified

69.40

58 / 108

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

60 / 106

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal-Bench

29 / 35

常识推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

Simple Bench

常规模式

54 / 63

Agent能力评测

共 2 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench - Telecom

22 / 35

τ²-Bench

77.20

18 / 40

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

IF Bench

72.30

9 / 29

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

40 / 46

查看评测深度分析与其他模型对比

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合？打开对比工具

MiniMax M2

发布机构

MiniMaxAI

查看发布机构详情

MiniMax-M2

模型解读

2025 年 10 月 27 日，中国 AI 公司 MiniMax 正式发布了其最新大语言模型 MiniMax M2，这款紧凑型模型专为编程任务和 Agentic 工作流设计，同时兼顾通用对话能力。作为 MiniMax 在开源领域的又一力作，M2 的推出标志着国产大模型在效率和成本优化上的新进展，迅速登上全球评测榜单的前列。

模型概述：轻量级设计，聚焦高效智能体

MiniMax M2 并非一款追求参数规模的巨型模型，而是定位于“轻量级”架构，总参数量达 2300 亿，其中激活参数仅 100 亿。这种设计理念源于对实际应用场景的考量，特别是可视化编程工具（如 MiniMax 的 Max 平台）和智能体工作流。不同于通用大模型的“全能型”定位，M2 更注重在特定任务中的深度优化，例如代码生成、代理式决策和多步推理，从而在资源受限的环境中实现高性能。

据官方描述，M2 支持长达 204,800 tokens 的上下文窗口，并可输出最多 131,072 tokens，这使得它在处理复杂编程项目或长链路 Agent 交互时表现出色。此外，该模型已开源，开发者可以通过 MiniMax 的平台快速集成，标志着开源生态在 Agent 领域的进一步扩展。

关键特性：编程与 Agent 的“加速器”

M2 的核心亮点在于其针对编程和智能体优化的专项能力。首先，在代码生成与调试方面，模型能够高效处理多语言编程任务，支持从 Python 到 JavaScript 的广泛场景，并集成可视化编程接口。这对于开发者构建自动化工作流尤为实用，例如在 DevOps 或低代码平台中的应用。

其次，作为 Agentic 工作流的专属引擎，M2 强调多代理协作和工具调用效率。它能模拟人类-like 的决策过程，减少幻觉发生率，并在实时交互中保持低延迟。相比前代模型，M2 在这些领域的改进体现在更强的上下文保持和错误恢复机制上，帮助智能体在复杂环境中更可靠地执行任务。

通用对话能力也是 M2 的亮点之一，尽管非主打，但其在自然语言理解上的表现已接近顶级模型水准。

性能评测：直逼国际前沿，性价比突出

第三方评测显示，MiniMax M2 在 Artificial Analysis 榜单上位居前五，综合能力被认为“直逼 GPT-5”或“比肩 Claude 4.5”。具体而言，它在代码基准（如 HumanEval）上的得分超越 DeepSeek-V3.2，在 Agent 任务（如 GAIA）中表现出色，推理速度和准确率均有显著提升。

定价方面，M2 采用亲民策略：每百万 tokens 输入 0.3 美元，输出 1.2 美元，仅为 Claude 系列的 8%。这使得它在商业部署中更具竞争力，尤其适合中小企业或初创团队。API 已于发布当日上线，支持 OpenRouter 等平台集成。

潜在应用与展望

M2 的发布为 AI 智能体生态注入新活力。在编程教育、自动化测试和多模态 Agent 构建等领域，它有望成为关键工具。同时，开源性质将吸引全球开发者贡献，加速模型迭代。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送