加载中...
加载中...
MiniMax M2.5
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
| Type | Condition | Input | Output |
|---|---|---|---|
| Text | - | $0.300/ 1M | $2.40/ 1M |
| Type | Condition | Input | Output |
|---|---|---|---|
| Text | - | $0.150/ 1M | $1.20/ 1M |
MiniMax M2.5是由稀宇科技(MiniMax)开发的一款大语言模型,于2026年2月12日正式上线。该模型激活参数量为10B,总参数量未公开,采用大规模强化学习训练,支持超过10种编程语言,包括Python、Java、JavaScript等。 其设计重点在于为Agent场景提供生产级支持,强调在真实复杂环境中的应用。
模型能力方面,MiniMax M2.5在编程、工具调用、搜索和办公生产力场景中表现出色。在编程领域,它支持全栈开发,覆盖Web、Android、iOS等多平台,能够从系统设计到代码审查的全流程处理;在SWE-Bench Verified基准测试中得分80.2%,Multi-SWE-Bench得分51.3%。 在工具调用和搜索方面,BrowseComp得分76.3%,优化了任务拆解和token消耗,相比上一代M2.1,完成任务速度提升37%。 在办公场景中,它处理Word、PPT、Excel等高阶任务,在GDPval-MM评测中平均胜率59.0%。 推理速度可达100 TPS,是部分主流模型的两倍左右。
外部评价显示,该模型在编程和Agentic性能上与Claude Opus 4.6相当,在某些基准测试中接近或超过国际顶尖水平。 用户反馈指出,其在工具调用和响应速度上表现良好,但复杂任务处理可能需更精确提示。 在BridgeBench基准中得分59.7%,略低于Claude Opus 4.6的60.1%,但成本更低。 部分测试显示,长上下文召回平均96.7%,Agent任务总分提升42.8%。 媒体报道称,其性价比高,适用于实际工作场景,但生成结果有时需进一步修改。
使用途径包括通过API接入,支持Anthropic API兼容模式,模型名为MiniMax-M2.5,可用于OpenClaw、Claude Code等工具。 已在MiniMax Agent平台上线,支持全能模式和专家模式,可处理行业研究、金融建模等任务。 定价分为两个版本:100 TPS版本输入0.3美元/百万token,输出2.4美元/百万token;50 TPS版本输出价格为前者的一半。连续运行一小时(100 token/s)成本1美元,(50 token/s)成本0.3美元,相当于部分国际模型的1/10至1/20。
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
