DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
工具
语言中文

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表MiniMax M2
MI

MiniMax M2

MiniMax-M2

发布时间: 2025-10-27更新于: 2025-10-27 17:43:132,818
在线体验GitHubHugging FaceCompare
模型参数
2300.0亿
上下文长度
205K
中文支持
支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

MiniMax M2

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
205K tokens
最大输出长度
暂无数据
模型类型
聊天大模型
发布时间
2025-10-27
模型文件大小
239.99 GB
MoE架构
是
总参数 / 激活参数
2300.0 亿 / 100 亿
知识截止
暂无数据
MiniMax M2

开源和体验地址

代码开源状态
MIT License
预训练权重开源
MIT License- 免费商用授权
GitHub 源码
https://github.com/MiniMax-AI/MiniMax-M2
Hugging Face
https://huggingface.co/MiniMaxAI/MiniMax-M2
在线体验
https://agent.minimax.io/
MiniMax M2

官方介绍与博客

官方论文
暂无官方论文
DataLearnerAI博客
MiniMaxAI开源MiniMax M2模型:Artificial Analysis评测显示综合智能得分超过Claude Opus 4.1,开源第一,全球第五。
MiniMax M2

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$0.3$1.2
MiniMax M2

评测结果

MiniMax M2 当前已收录的代表性评测结果包括 LiveCodeBench(15 / 108,得分 83)、IF Bench(7 / 27,得分 72.30)、MMLU Pro(39 / 115,得分 82)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规思考
工具使用
全部使用工具不使用工具

综合评估

共 5 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pro
中
82
39 / 115
GPQA Diamond
中
78
69 / 162
LiveBench
关闭
64.26
35 / 51
LiveBench
中
64.26
35 / 51
HLE
中
12.50
90 / 119

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
中
83
15 / 108
SWE-bench Verified
开启工具
69.40
43 / 93

数学推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
中
78
60 / 107

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal-Bench
开启工具
24
29 / 35

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench - Telecom
开启工具
87
20 / 33
τ²-Bench
开启工具
77.20
18 / 39

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
IF Bench
中
72.30
7 / 27

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
开启工具
44
27 / 33
查看评测深度分析与其他模型对比
MiniMax M2

发布机构

MiniMaxAI
MiniMaxAI
查看发布机构详情
MiniMax-M2

模型解读

2025 年 10 月 27 日,中国 AI 公司 MiniMax 正式发布了其最新大语言模型 MiniMax M2,这款紧凑型模型专为编程任务和 Agentic 工作流设计,同时兼顾通用对话能力。 作为 MiniMax 在开源领域的又一力作,M2 的推出标志着国产大模型在效率和成本优化上的新进展,迅速登上全球评测榜单的前列。

模型概述:轻量级设计,聚焦高效智能体

MiniMax M2 并非一款追求参数规模的巨型模型,而是定位于“轻量级”架构,总参数量达 2300 亿,其中激活参数仅 100 亿。 这种设计理念源于对实际应用场景的考量,特别是可视化编程工具(如 MiniMax 的 Max 平台)和智能体工作流。不同于通用大模型的“全能型”定位,M2 更注重在特定任务中的深度优化,例如代码生成、代理式决策和多步推理,从而在资源受限的环境中实现高性能。

据官方描述,M2 支持长达 204,800 tokens 的上下文窗口,并可输出最多 131,072 tokens,这使得它在处理复杂编程项目或长链路 Agent 交互时表现出色。 此外,该模型已开源,开发者可以通过 MiniMax 的平台快速集成,标志着开源生态在 Agent 领域的进一步扩展。

关键特性:编程与 Agent 的“加速器”

M2 的核心亮点在于其针对编程和智能体优化的专项能力。首先,在代码生成与调试方面,模型能够高效处理多语言编程任务,支持从 Python 到 JavaScript 的广泛场景,并集成可视化编程接口。 这对于开发者构建自动化工作流尤为实用,例如在 DevOps 或低代码平台中的应用。

其次,作为 Agentic 工作流的专属引擎,M2 强调多代理协作和工具调用效率。它能模拟人类-like 的决策过程,减少幻觉发生率,并在实时交互中保持低延迟。 相比前代模型,M2 在这些领域的改进体现在更强的上下文保持和错误恢复机制上,帮助智能体在复杂环境中更可靠地执行任务。

通用对话能力也是 M2 的亮点之一,尽管非主打,但其在自然语言理解上的表现已接近顶级模型水准。

性能评测:直逼国际前沿,性价比突出

第三方评测显示,MiniMax M2 在 Artificial Analysis 榜单上位居前五,综合能力被认为“直逼 GPT-5”或“比肩 Claude 4.5”。 具体而言,它在代码基准(如 HumanEval)上的得分超越 DeepSeek-V3.2,在 Agent 任务(如 GAIA)中表现出色,推理速度和准确率均有显著提升。

定价方面,M2 采用亲民策略:每百万 tokens 输入 0.3 美元,输出 1.2 美元,仅为 Claude 系列的 8%。 这使得它在商业部署中更具竞争力,尤其适合中小企业或初创团队。API 已于发布当日上线,支持 OpenRouter 等平台集成。

潜在应用与展望

M2 的发布为 AI 智能体生态注入新活力。在编程教育、自动化测试和多模态 Agent 构建等领域,它有望成为关键工具。同时,开源性质将吸引全球开发者贡献,加速模型迭代。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码