DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表MiniMax-M1-80k
MI

MiniMax-M1-80k

推理大模型

MiniMax-M1-80k

发布时间: 2025-06-16更新于: 2025-06-17 13:42:351,149
在线体验GitHubHugging FaceCompare
模型参数
4560.0亿
上下文长度
1000K
中文支持
支持
推理能力

MiniMax-M1-80k 是由 MiniMaxAI 发布的 AI 模型,发布时间为 2025-06-16,定位为 推理大模型,参数规模约为 4560.0B,上下文长度为 1000K,模型文件大小约 912GB,采用 MINIMAX MODEL LICENSE 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

MiniMax-M1-80k

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
1000K tokens
最大输出长度
81920 tokens
模型类型
推理大模型
发布时间
2025-06-16
模型文件大小
912GB
MoE架构
否
总参数 / 激活参数
4560.0 亿 / 不涉及
知识截止
暂无数据
MiniMax-M1-80k

开源和体验地址

代码开源状态
MIT License
预训练权重开源
MINIMAX MODEL LICENSE- 免费商用授权
GitHub 源码
https://github.com/MiniMax-AI/MiniMax-M1
Hugging Face
https://huggingface.co/MiniMaxAI/MiniMax-M1-40k
在线体验
https://huggingface.co/spaces/MiniMaxAI/MiniMax-M1
MiniMax-M1-80k

官方介绍与博客

官方论文
MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention
DataLearnerAI博客
MiniMax 发布 MiniMax-Text-01 模型:聚焦超长上下文与线性注意力技术
MiniMax-M1-80k

API接口信息

接口速度
2/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准计费Standard
模态输入输出
文本$1.3$2.2
MiniMax-M1-80k

评测结果

MiniMax-M1-80k 当前已收录的代表性评测结果包括 AIME 2024(19 / 62,得分 86)、MATH-500(15 / 43,得分 96.80)、MMLU Pro(44 / 117,得分 81.10)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部常规

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
MMLU Pro
关闭
81.10
44 / 117
GPQA Diamond
关闭
70
102 / 166
HLE
关闭
8.40
114 / 131

常识问答

共 1 项评测
评测名称 / 模式
得分
排名/总数
SimpleQA
关闭
18.50
32 / 45

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
关闭
65
55 / 109
SWE-bench Verified
关闭
56
70 / 96

数学推理

共 3 项评测
评测名称 / 模式
得分
排名/总数
MATH-500
关闭
96.80
15 / 43
AIME 2024
关闭
86
19 / 62
AIME2025
关闭
76.90
63 / 106
查看评测深度分析与其他模型对比
MiniMax-M1-80k

发布机构

MiniMaxAI
MiniMaxAI
查看发布机构详情
MiniMax-M1-80k

模型解读

MiniMaxAI于2025年6月17日正式发布了其新一代大模型——MiniMax-M1。其中,MiniMax-M1-80k是M1系列中的旗舰版本,它拥有高达80K Token的“思考预算”(即最大生成长度),代表了当前MiniMaxAI在开源大型推理模型领域的最高水准,专为需要极致深度思考和超长内容生成的复杂任务而设计,其能力非常强大!

MiniMax-M1-80k:核心特性与“极致”思考能力

作为MiniMax-M1系列的完整体现,M1-80k不仅继承了该系列开创性的架构设计,更将其“扩展思考”的能力推向了新的高度:

  • 顶尖混合架构与闪电注意力: M1-80k同样构建于混合专家(MoE)架构之上,并搭载了高效的闪电注意力(Lightning Attention)机制。这一组合确保了模型在处理大规模计算时的卓越效率与性能。
  • 百万级上下文与80K生成: 它原生支持100万Token的超长上下文输入,并能生成长达80K Token的输出。这意味着M1-80k能够消化极为庞大的信息量,并进行更深层次的思考和更详尽的解决方案生成。
  • 最大化测试时计算扩展: 80K的生成长度充分体现了M1架构在“测试时计算扩展”(scaling test-time compute)方面的优势。通过投入更多的计算资源进行更长的推理过程,模型在复杂任务上的表现得到显著提升。
  • 深度强化学习优化: M1-80k是经过完整且针对性强化学习(RL)流程的产物,采用了创新的CISPO算法,并在训练数据、长度扩展策略及稳定性方面进行了特别优化,以充分发挥其长程推理潜力。

MiniMax-M1-80k:性能表现新高度

相较于M1-40k,MiniMax-M1-80k在多个关键基准测试中展现了进一步的性能提升,特别是在对思考深度和长度要求极高的任务上:

图:领先商业和开源模型在各项基准测试中的性能对比(来源:MiniMax-M1 论文,示意图,具体M1-80k分数见下文)


根据MiniMaxAI发布的评测数据(Table 2),MiniMax-M1-80k的卓越性能体现在:

基准测试MiniMax-M1-40kMiniMax-M1-80k突出表现 (M1-80k)
数学 (AIME 2024)83.3%86.0%开源模型中名列前茅,展现更强数学推理能力
数学 (AIME 2025)74.6%76.9%在更具挑战性的新基准上持续提升
通用编码 (LiveCodeBench)62.3%65.0%编程能力进一步增强,与Qwen3-235B持平
软件工程 (SWE-bench Verified)55.6%56.0%在复杂真实世界代码任务上表现更佳
长上下文 (OpenAI-MRCR 128k)76.1%73.4%*依然顶尖,*此处分数略低于40k,可能与特定评测设置或数据分布有关,但整体长上下文能力强大
智能体工具使用 (TAU-bench airline)60.0%62.0%工具使用熟练度更高,超越众多模型

表格2:MiniMax-M1-40k与M1-80k在部分核心基准上的性能对比 (数据来源: MiniMax-M1 论文 Table 2)


这些数据清晰地表明,通过扩展测试时计算(即增加生成长度),MiniMax-M1-80k在多数复杂任务上实现了性能的进一步提升,验证了其架构设计和训练策略的成功。

专为扩展思考而生的训练优化

MiniMax-M1-80k的卓越性能并非简单地延长输出,而是源于一系列精心的训练优化:

  • 数据精选与调整: 在40K模型基础上,为80K训练筛选了更具挑战性的数学和编码难题,并适当降低了可能导致长上下文训练不稳定的合成推理数据比例。
  • 分阶段长度扩展: 采用从40K逐步到48K、56K直至80K的分阶段窗口扩展RL策略,确保了训练过程的稳定性和模型对长序列的逐步适应。
  • 不稳定性问题解决: 针对长序列生成后期可能出现的模式崩溃问题,实施了包括重复模式检测与早停、样本级与Token级损失归一化结合、降低梯度裁剪阈值等关键技术,有效保障了长程生成的质量和稳定性。

获取与使用

MiniMaxAI致力于开源共享,MiniMax-M1-80k作为其当前最强大的开源推理模型,同样对社区开放:

  • 模型获取: 可在 GitHub (https://github.com/MiniMax-AI/MiniMax-M1) 和 Hugging Face 平台找到M1系列的权重和相关资源。
  • 框架支持: 模型支持 vLLM 和 Transformers 等主流推理框架,方便集成到现有工作流中。
  • 商业API: MiniMaxAI也通过 minimax.io 提供商业级API服务。

总结

MiniMax-M1-80k代表了当前开源大型推理模型在扩展思考和长上下文处理能力上的新标杆。凭借其高达80K Token的生成预算、百万级上下文窗口、创新的闪电注意力和高效的CISPO强化学习,M1-80k在各项复杂任务,尤其是需要深度推理和详尽输出的场景中,展现了世界一流的性能。对于追求极致AI推理能力的研究者和开发者而言,MiniMax-M1-80k无疑是一个不容错过的强大工具。

扩展链接:

  • MiniMax-M1 GitHub仓库: https://github.com/MiniMax-AI/MiniMax-M1

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码