加载中...

MiniMax M2

Name: MiniMax-M2
Availability: InStock
Author: MiniMaxAI

MiniMax-M2

发布时间: 2025-10-27更新于: 2025-10-27 17:43:132,818

在线体验 GitHub Hugging Face Compare

模型参数

2300.0亿

上下文长度

205K

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

MiniMax M2

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

205K tokens

最大输出长度

暂无数据

模型类型

聊天大模型

发布时间

2025-10-27

模型文件大小

239.99 GB

MoE架构

是

总参数 / 激活参数

2300.0 亿 / 100 亿

知识截止

暂无数据

MiniMax M2

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MIT License- 免费商用授权

GitHub 源码

https://github.com/MiniMax-AI/MiniMax-M2

Hugging Face

https://huggingface.co/MiniMaxAI/MiniMax-M2

在线体验

https://agent.minimax.io/

MiniMax M2

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

MiniMaxAI开源MiniMax M2模型：Artificial Analysis评测显示综合智能得分超过Claude Opus 4.1，开源第一，全球第五。

MiniMax M2

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	$0.3	$1.2

MiniMax M2

评测结果

MiniMax M2 当前已收录的代表性评测结果包括 LiveCodeBench（15 / 108，得分 83）、IF Bench（7 / 27，得分 72.30）、MMLU Pro（39 / 115，得分 82）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 5 项评测

评测名称 / 模式

得分

排名/总数

MMLU Pro

中

39 / 115

GPQA Diamond

中

69 / 162

LiveBench

关闭

64.26

35 / 51

LiveBench

中

64.26

35 / 51

HLE

中

12.50

90 / 119

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

中

15 / 108

SWE-bench Verified

开启工具

69.40

43 / 93

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

中

60 / 107

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal-Bench

开启工具

29 / 35

Agent能力评测

共 2 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench - Telecom

开启工具

20 / 33

τ²-Bench

开启工具

77.20

18 / 39

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

IF Bench

中

72.30

7 / 27

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

开启工具

27 / 33

查看评测深度分析与其他模型对比

MiniMax M2

发布机构

MiniMaxAI

查看发布机构详情

MiniMax-M2

模型解读

2025 年 10 月 27 日，中国 AI 公司 MiniMax 正式发布了其最新大语言模型 MiniMax M2，这款紧凑型模型专为编程任务和 Agentic 工作流设计，同时兼顾通用对话能力。作为 MiniMax 在开源领域的又一力作，M2 的推出标志着国产大模型在效率和成本优化上的新进展，迅速登上全球评测榜单的前列。

模型概述：轻量级设计，聚焦高效智能体

MiniMax M2 并非一款追求参数规模的巨型模型，而是定位于“轻量级”架构，总参数量达 2300 亿，其中激活参数仅 100 亿。这种设计理念源于对实际应用场景的考量，特别是可视化编程工具（如 MiniMax 的 Max 平台）和智能体工作流。不同于通用大模型的“全能型”定位，M2 更注重在特定任务中的深度优化，例如代码生成、代理式决策和多步推理，从而在资源受限的环境中实现高性能。

据官方描述，M2 支持长达 204,800 tokens 的上下文窗口，并可输出最多 131,072 tokens，这使得它在处理复杂编程项目或长链路 Agent 交互时表现出色。此外，该模型已开源，开发者可以通过 MiniMax 的平台快速集成，标志着开源生态在 Agent 领域的进一步扩展。

关键特性：编程与 Agent 的“加速器”

M2 的核心亮点在于其针对编程和智能体优化的专项能力。首先，在代码生成与调试方面，模型能够高效处理多语言编程任务，支持从 Python 到 JavaScript 的广泛场景，并集成可视化编程接口。这对于开发者构建自动化工作流尤为实用，例如在 DevOps 或低代码平台中的应用。

其次，作为 Agentic 工作流的专属引擎，M2 强调多代理协作和工具调用效率。它能模拟人类-like 的决策过程，减少幻觉发生率，并在实时交互中保持低延迟。相比前代模型，M2 在这些领域的改进体现在更强的上下文保持和错误恢复机制上，帮助智能体在复杂环境中更可靠地执行任务。

通用对话能力也是 M2 的亮点之一，尽管非主打，但其在自然语言理解上的表现已接近顶级模型水准。

性能评测：直逼国际前沿，性价比突出

第三方评测显示，MiniMax M2 在 Artificial Analysis 榜单上位居前五，综合能力被认为“直逼 GPT-5”或“比肩 Claude 4.5”。具体而言，它在代码基准（如 HumanEval）上的得分超越 DeepSeek-V3.2，在 Agent 任务（如 GAIA）中表现出色，推理速度和准确率均有显著提升。

定价方面，M2 采用亲民策略：每百万 tokens 输入 0.3 美元，输出 1.2 美元，仅为 Claude 系列的 8%。这使得它在商业部署中更具竞争力，尤其适合中小企业或初创团队。API 已于发布当日上线，支持 OpenRouter 等平台集成。

潜在应用与展望

M2 的发布为 AI 智能体生态注入新活力。在编程教育、自动化测试和多模态 Agent 构建等领域，它有望成为关键工具。同时，开源性质将吸引全球开发者贡献，加速模型迭代。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

加载中...

MiniMax M2

MiniMax-M2

发布时间: 2025-10-27更新于: 2025-10-27 17:43:132,818

在线体验 GitHub Hugging Face Compare

模型参数

2300.0亿

上下文长度

205K

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

MiniMax M2

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

205K tokens

最大输出长度

暂无数据

模型类型

聊天大模型

发布时间

2025-10-27

模型文件大小

239.99 GB

MoE架构

是

总参数 / 激活参数

2300.0 亿 / 100 亿

知识截止

暂无数据

MiniMax M2

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MIT License- 免费商用授权

GitHub 源码

https://github.com/MiniMax-AI/MiniMax-M2

Hugging Face

https://huggingface.co/MiniMaxAI/MiniMax-M2

在线体验

https://agent.minimax.io/

MiniMax M2

官方介绍与博客

官方论文

暂无官方论文

DataLearnerAI博客

MiniMaxAI开源MiniMax M2模型：Artificial Analysis评测显示综合智能得分超过Claude Opus 4.1，开源第一，全球第五。

MiniMax M2

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	$0.3	$1.2

MiniMax M2

评测结果

综合评估

共 5 项评测

评测名称 / 模式

得分

排名/总数

MMLU Pro

中

39 / 115

GPQA Diamond

中

69 / 162

LiveBench

关闭

64.26

35 / 51

LiveBench

中

64.26

35 / 51

HLE

中

12.50

90 / 119

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench

中

15 / 108

SWE-bench Verified

开启工具

69.40

43 / 93

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

中

60 / 107

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal-Bench

开启工具

29 / 35

Agent能力评测

共 2 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench - Telecom

开启工具

20 / 33

τ²-Bench

开启工具

77.20

18 / 39

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

IF Bench

中

72.30

7 / 27

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

开启工具

27 / 33

查看评测深度分析与其他模型对比

MiniMax M2

发布机构

MiniMaxAI

查看发布机构详情

MiniMax-M2

模型解读

模型概述：轻量级设计，聚焦高效智能体

关键特性：编程与 Agent 的“加速器”

通用对话能力也是 M2 的亮点之一，尽管非主打，但其在自然语言理解上的表现已接近顶级模型水准。

性能评测：直逼国际前沿，性价比突出

潜在应用与展望

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送