MiniMax-M1-40k
发布时间: 2025-06-16 7
支持
1000K tokens
81920 tokens
推理大模型
2025-06-16
912GB
输入支持
输入不支持
输入不支持
输入不支持
输入不支持
输出支持
输出不支持
输出不支持
输出不支持
输出不支持
MiniMaxAI于2025年6月17日正式发布了其新一代大模型——MiniMax-M1。其中,MiniMax-M1-40k是M1系列中一个关键版本,它拥有40K Token的“思考预算”(即最大生成长度),代表了完整80K模型训练过程中的一个重要中间阶段,但其本身已是一款功能非常强大且表现卓越的开源推理模型。
作为MiniMax-M1家族的一员,M1-40k继承了该系列架构的核心优势,并针对其40K的生成能力进行了优化:
MiniMax-M1-40k在多项基准测试中展现了其作为一款成熟模型的强大实力,尤其在特定复杂场景下表现突出:
图:领先商业和开源模型在各项基准测试中的性能对比(来源:MiniMax-M1 论文,示意图,具体M1-40k分数见下文)
根据MiniMaxAI发布的评测数据(Table 2),MiniMax-M1-40k取得了以下亮眼成绩:
这些数据表明,MiniMax-M1-40k并非仅仅是一个“中间版本”,而是一款在多个关键领域都能提供强大竞争力的实用模型。
MiniMax-M1-40k的开发得益于MiniMaxAI在高效RL扩展方面的深入研究。其训练不仅采用了包括数学、编码、逻辑推理、软件工程在内的多样化、高质量数据集,还应用了创新的CISPO强化学习算法。虽然它是向着更长“思考预算”(80K Token)迈进的一步,但其本身已经过充分的RL训练,使其能够在40K Token的生成范围内稳定输出高质量、具有深度思考的回复。
与M1系列的其他模型一样,MiniMaxAI已将MiniMax-M1-40k模型公开发布,致力于推动AI社区的共同进步:
MiniMax-M1-40k作为MiniMax-M1家族的重要成员,凭借其百万级上下文处理能力、40K Token的强大生成预算,以及由闪电注意力和CISPO算法带来的高效性与高性能,为开发者和研究者提供了一个极具吸引力的开源选择。它在软件工程、智能体工具使用和长上下文任务上的出色表现,使其特别适用于构建需要深度理解和复杂交互的AI应用。对于那些寻求在计算效率和强大推理能力之间取得平衡的用户而言,MiniMax-M1-40k无疑是一个值得重点关注和尝试的模型。
扩展链接:
关注DataLearnerAI微信公众号,接受最新大模型资讯