MiniMax-M1-80k
发布时间: 2025-06-16 11
支持
1000K tokens
81920 tokens
推理大模型
2025-06-16
912GB
输入支持
输入不支持
输入不支持
输入不支持
输入不支持
输出支持
输出不支持
输出不支持
输出不支持
输出不支持
MiniMaxAI于2025年6月17日正式发布了其新一代大模型——MiniMax-M1。其中,MiniMax-M1-80k是M1系列中的旗舰版本,它拥有高达80K Token的“思考预算”(即最大生成长度),代表了当前MiniMaxAI在开源大型推理模型领域的最高水准,专为需要极致深度思考和超长内容生成的复杂任务而设计,其能力非常强大!
作为MiniMax-M1系列的完整体现,M1-80k不仅继承了该系列开创性的架构设计,更将其“扩展思考”的能力推向了新的高度:
相较于M1-40k,MiniMax-M1-80k在多个关键基准测试中展现了进一步的性能提升,特别是在对思考深度和长度要求极高的任务上:
图:领先商业和开源模型在各项基准测试中的性能对比(来源:MiniMax-M1 论文,示意图,具体M1-80k分数见下文)
根据MiniMaxAI发布的评测数据(Table 2),MiniMax-M1-80k的卓越性能体现在:
基准测试 | MiniMax-M1-40k | MiniMax-M1-80k | 突出表现 (M1-80k) |
---|---|---|---|
数学 (AIME 2024) | 83.3% | 86.0% | 开源模型中名列前茅,展现更强数学推理能力 |
数学 (AIME 2025) | 74.6% | 76.9% | 在更具挑战性的新基准上持续提升 |
通用编码 (LiveCodeBench) | 62.3% | 65.0% | 编程能力进一步增强,与Qwen3-235B持平 |
软件工程 (SWE-bench Verified) | 55.6% | 56.0% | 在复杂真实世界代码任务上表现更佳 |
长上下文 (OpenAI-MRCR 128k) | 76.1% | 73.4%* | 依然顶尖,*此处分数略低于40k,可能与特定评测设置或数据分布有关,但整体长上下文能力强大 |
智能体工具使用 (TAU-bench airline) | 60.0% | 62.0% | 工具使用熟练度更高,超越众多模型 |
表格2:MiniMax-M1-40k与M1-80k在部分核心基准上的性能对比 (数据来源: MiniMax-M1 论文 Table 2)
这些数据清晰地表明,通过扩展测试时计算(即增加生成长度),MiniMax-M1-80k在多数复杂任务上实现了性能的进一步提升,验证了其架构设计和训练策略的成功。
MiniMax-M1-80k的卓越性能并非简单地延长输出,而是源于一系列精心的训练优化:
MiniMaxAI致力于开源共享,MiniMax-M1-80k作为其当前最强大的开源推理模型,同样对社区开放:
MiniMax-M1-80k代表了当前开源大型推理模型在扩展思考和长上下文处理能力上的新标杆。凭借其高达80K Token的生成预算、百万级上下文窗口、创新的闪电注意力和高效的CISPO强化学习,M1-80k在各项复杂任务,尤其是需要深度推理和详尽输出的场景中,展现了世界一流的性能。对于追求极致AI推理能力的研究者和开发者而言,MiniMax-M1-80k无疑是一个不容错过的强大工具。
扩展链接:
关注DataLearnerAI微信公众号,接受最新大模型资讯