MiniMax-M1-80k

推理大模型

MiniMax-M1-80k

发布时间: 2025-06-16

802

GitHub Hugging Face 在线体验

模型参数（Parameters）

4560.0

最高上下文长度（Context Length）

1000K

是否支持中文

支持

推理能力（Reasoning）

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

1000K tokens

最长输出结果

81920 tokens

模型类型

推理大模型

发布时间

2025-06-16

模型预文件大小

912GB

开源和体验地址

代码开源状态

MIT License

预训练权重开源

MINIMAX MODEL LICENSE - 免费商用授权

GitHub 源码

https://github.com/MiniMax-AI/MiniMax-M1

Hugging Face

https://huggingface.co/MiniMaxAI/MiniMax-M1-40k

在线体验

https://huggingface.co/spaces/MiniMaxAI/MiniMax-M1

官方介绍与博客

官方论文

MiniMax-M1: Scaling Test-Time Compute Efficiently with Lightning Attention

DataLearnerAI博客

MiniMax 发布 MiniMax-Text-01 模型：聚焦超长上下文与线性注意力技术

API接口信息

接口速度（满分5分）

接口价格

默认单位：$/100万 tokens；若计费单位不同，则以供应商公开的原始标注为准。

标准计费 Standard

模态	输入	输出
文本	1.3 美元/100万tokens	2.2 美元/100 万tokens

MiniMax-M1-80k模型在各大评测榜单的评分

综合评估

共 3 项评测

评测名称 / 模式

得分

排名/总模型数

MMLU Pro normal

81.10

33 / 105

GPQA Diamond normal

70 / 133

HLE normal

8.40

52 / 68

真实性评估

共 1 项评测

评测名称 / 模式

得分

排名/总模型数

SimpleQA normal

18.50

30 / 43

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总模型数

LiveCodeBench normal

40 / 94

SWE-bench Verified normal

45 / 66

数学推理

共 3 项评测

评测名称 / 模式

得分

排名/总模型数

MATH-500 normal

96.80

14 / 42

AIME 2024 normal

19 / 62

AIME2025 normal

76.90

50 / 93

发布机构

MiniMaxAI

查看发布机构详情

MiniMax-M1-80k模型解读

MiniMaxAI于2025年6月17日正式发布了其新一代大模型——MiniMax-M1。其中，MiniMax-M1-80k是M1系列中的旗舰版本，它拥有高达80K Token的“思考预算”（即最大生成长度），代表了当前MiniMaxAI在开源大型推理模型领域的最高水准，专为需要极致深度思考和超长内容生成的复杂任务而设计，其能力非常强大！

MiniMax-M1-80k：核心特性与“极致”思考能力

作为MiniMax-M1系列的完整体现，M1-80k不仅继承了该系列开创性的架构设计，更将其“扩展思考”的能力推向了新的高度：

顶尖混合架构与闪电注意力: M1-80k同样构建于混合专家（MoE）架构之上，并搭载了高效的闪电注意力（Lightning Attention）机制。这一组合确保了模型在处理大规模计算时的卓越效率与性能。
百万级上下文与80K生成: 它原生支持100万Token的超长上下文输入，并能生成长达80K Token的输出。这意味着M1-80k能够消化极为庞大的信息量，并进行更深层次的思考和更详尽的解决方案生成。
最大化测试时计算扩展: 80K的生成长度充分体现了M1架构在“测试时计算扩展”（scaling test-time compute）方面的优势。通过投入更多的计算资源进行更长的推理过程，模型在复杂任务上的表现得到显著提升。
深度强化学习优化: M1-80k是经过完整且针对性强化学习（RL）流程的产物，采用了创新的CISPO算法，并在训练数据、长度扩展策略及稳定性方面进行了特别优化，以充分发挥其长程推理潜力。

MiniMax-M1-80k：性能表现新高度

相较于M1-40k，MiniMax-M1-80k在多个关键基准测试中展现了进一步的性能提升，特别是在对思考深度和长度要求极高的任务上：

图：领先商业和开源模型在各项基准测试中的性能对比（来源：MiniMax-M1 论文，示意图，具体M1-80k分数见下文）

根据MiniMaxAI发布的评测数据（Table 2），MiniMax-M1-80k的卓越性能体现在：

基准测试	MiniMax-M1-40k	MiniMax-M1-80k	突出表现 (M1-80k)
数学 (AIME 2024)	83.3%	86.0%	开源模型中名列前茅，展现更强数学推理能力
数学 (AIME 2025)	74.6%	76.9%	在更具挑战性的新基准上持续提升
通用编码 (LiveCodeBench)	62.3%	65.0%	编程能力进一步增强，与Qwen3-235B持平
软件工程 (SWE-bench Verified)	55.6%	56.0%	在复杂真实世界代码任务上表现更佳
长上下文 (OpenAI-MRCR 128k)	76.1%	73.4%*	依然顶尖，*此处分数略低于40k，可能与特定评测设置或数据分布有关，但整体长上下文能力强大
智能体工具使用 (TAU-bench airline)	60.0%	62.0%	工具使用熟练度更高，超越众多模型

表格2：MiniMax-M1-40k与M1-80k在部分核心基准上的性能对比 (数据来源: MiniMax-M1 论文 Table 2)

这些数据清晰地表明，通过扩展测试时计算（即增加生成长度），MiniMax-M1-80k在多数复杂任务上实现了性能的进一步提升，验证了其架构设计和训练策略的成功。

专为扩展思考而生的训练优化

MiniMax-M1-80k的卓越性能并非简单地延长输出，而是源于一系列精心的训练优化：

数据精选与调整: 在40K模型基础上，为80K训练筛选了更具挑战性的数学和编码难题，并适当降低了可能导致长上下文训练不稳定的合成推理数据比例。
分阶段长度扩展: 采用从40K逐步到48K、56K直至80K的分阶段窗口扩展RL策略，确保了训练过程的稳定性和模型对长序列的逐步适应。
不稳定性问题解决: 针对长序列生成后期可能出现的模式崩溃问题，实施了包括重复模式检测与早停、样本级与Token级损失归一化结合、降低梯度裁剪阈值等关键技术，有效保障了长程生成的质量和稳定性。

获取与使用

MiniMaxAI致力于开源共享，MiniMax-M1-80k作为其当前最强大的开源推理模型，同样对社区开放：

模型获取: 可在 GitHub (https://github.com/MiniMax-AI/MiniMax-M1) 和 Hugging Face 平台找到M1系列的权重和相关资源。
框架支持: 模型支持 vLLM 和 Transformers 等主流推理框架，方便集成到现有工作流中。
商业API: MiniMaxAI也通过 minimax.io 提供商业级API服务。

总结

MiniMax-M1-80k代表了当前开源大型推理模型在扩展思考和长上下文处理能力上的新标杆。凭借其高达80K Token的生成预算、百万级上下文窗口、创新的闪电注意力和高效的CISPO强化学习，M1-80k在各项复杂任务，尤其是需要深度推理和详尽输出的场景中，展现了世界一流的性能。对于追求极致AI推理能力的研究者和开发者而言，MiniMax-M1-80k无疑是一个不容错过的强大工具。

扩展链接:

MiniMax-M1 GitHub仓库: https://github.com/MiniMax-AI/MiniMax-M1

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号，接受最新大模型资讯