DataLearner 标志DataLearnerAI
最新AI资讯
大模型评测
大模型列表
大模型对比
资源中心
工具
语言中文

加载中...

DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表MiniMax M2.5
MI

MiniMax M2.5

MiniMax M2.5

发布时间: 2026-02-12更新于: 2026-03-29 10:29:03.6783,527
在线体验GitHubHugging FaceCompare
模型参数
2290.0亿
上下文长度
128K
中文支持
支持
推理能力

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

MiniMax M2.5

模型基本信息

推理过程
支持
思考模式
思考水平 · 开启 (On) (默认)思考水平 · 关闭 (Off)
上下文长度
128K tokens
最大输出长度
暂无数据
模型类型
推理大模型
发布时间
2026-02-12
模型文件大小
230GB
MoE架构
是
总参数 / 激活参数
2290.0 亿 / 100 亿
知识截止
暂无数据
MiniMax M2.5

开源和体验地址

代码开源状态
Modified MIT License
预训练权重开源
Modified MIT License- 免费商用授权
GitHub 源码
https://github.com/MiniMax-AI/MiniMax-M2.5
Hugging Face
https://huggingface.co/MiniMaxAI/MiniMax-M2.5
在线体验
https://agent.minimax.io/
MiniMax M2.5

官方介绍与博客

官方论文
MiniMax M2.5: Built for Real-World Productivity.
DataLearnerAI博客
暂无介绍博客
MiniMax M2.5

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
了解不同定价模式详解
标准模式
类型适用条件输入输出
文本-$0.300/ 1M$2.40/ 1M
加速模式
类型适用条件输入输出
文本-$0.150/ 1M$1.20/ 1M
MiniMax M2.5

评测结果

MiniMax M2.5 当前已收录的代表性评测结果包括 SWE-bench Verified(6 / 93,得分 80.20)、Pinch Bench(6 / 37,得分 87.80)、GPQA Diamond(34 / 162,得分 85.20)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部思考
思考模式细分 (2)
全部默认 (开启)中
工具使用
全部使用工具不使用工具

综合评估

共 2 项评测
评测名称 / 模式
得分
排名/总数
GPQA Diamond
中
85.20
34 / 162
HLE
中
19.40
72 / 119

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
SWE-bench Verified
开启工具
80.20
6 / 93
SWE-Bench Pro - Public
开启工具
55.40
7 / 22

数学推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
AIME2025
中
86.30
48 / 107

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench - Telecom
开启工具
97.80
9 / 33
Pinch Bench
开启工具
87.80
6 / 37

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
IF Bench
开启工具
70
10 / 27

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
开启工具
76.30
8 / 33

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数
Terminal Bench 2.0
开启工具
51.70
14 / 28

生产力知识

共 1 项评测
评测名称 / 模式
得分
排名/总数
GDPval-AA
中
36
11 / 15

长上下文能力

共 1 项评测
评测名称 / 模式
得分
排名/总数
AA-LCR
中
69.50
3 / 13
查看评测深度分析与其他模型对比
MiniMax M2.5

发布机构

MiniMaxAI
MiniMaxAI
查看发布机构详情
MiniMax M2.5

模型解读

MiniMax M2.5是由稀宇科技(MiniMax)开发的一款大语言模型,于2026年2月12日正式上线。该模型激活参数量为10B,总参数量未公开,采用大规模强化学习训练,支持超过10种编程语言,包括Python、Java、JavaScript等。 其设计重点在于为Agent场景提供生产级支持,强调在真实复杂环境中的应用。

模型能力方面,MiniMax M2.5在编程、工具调用、搜索和办公生产力场景中表现出色。在编程领域,它支持全栈开发,覆盖Web、Android、iOS等多平台,能够从系统设计到代码审查的全流程处理;在SWE-Bench Verified基准测试中得分80.2%,Multi-SWE-Bench得分51.3%。 在工具调用和搜索方面,BrowseComp得分76.3%,优化了任务拆解和token消耗,相比上一代M2.1,完成任务速度提升37%。 在办公场景中,它处理Word、PPT、Excel等高阶任务,在GDPval-MM评测中平均胜率59.0%。 推理速度可达100 TPS,是部分主流模型的两倍左右。

外部评价显示,该模型在编程和Agentic性能上与Claude Opus 4.6相当,在某些基准测试中接近或超过国际顶尖水平。 用户反馈指出,其在工具调用和响应速度上表现良好,但复杂任务处理可能需更精确提示。 在BridgeBench基准中得分59.7%,略低于Claude Opus 4.6的60.1%,但成本更低。 部分测试显示,长上下文召回平均96.7%,Agent任务总分提升42.8%。 媒体报道称,其性价比高,适用于实际工作场景,但生成结果有时需进一步修改。

使用途径包括通过API接入,支持Anthropic API兼容模式,模型名为MiniMax-M2.5,可用于OpenClaw、Claude Code等工具。 已在MiniMax Agent平台上线,支持全能模式和专家模式,可处理行业研究、金融建模等任务。 定价分为两个版本:100 TPS版本输入0.3美元/百万token,输出2.4美元/百万token;50 TPS版本输出价格为前者的一半。连续运行一小时(100 token/s)成本1美元,(50 token/s)成本0.3美元,相当于部分国际模型的1/10至1/20。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码