加载中...

MiniMax M2.5

Name: MiniMax M2.5
Price: 0.3 USD
Availability: InStock
Author: MiniMaxAI

发布时间: 2026-02-12更新于: 2026-03-29 10:29:03.6783,527

在线体验 GitHub Hugging Face Compare

模型参数

2290.0亿

上下文长度

128K

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

MiniMax M2.5

模型基本信息

推理过程

支持

思考模式

思考水平 · 开启 (On) (默认)思考水平 · 关闭 (Off)

上下文长度

128K tokens

最大输出长度

暂无数据

模型类型

推理大模型

发布时间

2026-02-12

模型文件大小

230GB

MoE架构

是

总参数 / 激活参数

2290.0 亿 / 100 亿

知识截止

暂无数据

MiniMax M2.5

开源和体验地址

代码开源状态

Modified MIT License

预训练权重开源

Modified MIT License- 免费商用授权

GitHub 源码

https://github.com/MiniMax-AI/MiniMax-M2.5

Hugging Face

https://huggingface.co/MiniMaxAI/MiniMax-M2.5

在线体验

https://agent.minimax.io/

MiniMax M2.5

官方介绍与博客

官方论文

MiniMax M2.5: Built for Real-World Productivity.

DataLearnerAI博客

暂无介绍博客

MiniMax M2.5

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$0.300/ 1M	$2.40/ 1M

加速模式

类型	适用条件	输入	输出
文本	-	$0.150/ 1M	$1.20/ 1M

MiniMax M2.5

评测结果

MiniMax M2.5 当前已收录的代表性评测结果包括 SWE-bench Verified（6 / 93，得分 80.20）、Pinch Bench（6 / 37，得分 87.80）、GPQA Diamond（34 / 162，得分 85.20）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 2 项评测

评测名称 / 模式

得分

排名/总数

GPQA Diamond

中

85.20

34 / 162

HLE

中

19.40

72 / 119

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

SWE-bench Verified

开启工具

80.20

6 / 93

SWE-Bench Pro - Public

开启工具

55.40

7 / 22

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

中

86.30

48 / 107

Agent能力评测

共 2 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench - Telecom

开启工具

97.80

9 / 33

Pinch Bench

开启工具

87.80

6 / 37

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

IF Bench

开启工具

10 / 27

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

开启工具

76.30

8 / 33

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

开启工具

51.70

14 / 28

生产力知识

共 1 项评测

评测名称 / 模式

得分

排名/总数

GDPval-AA

中

11 / 15

长上下文能力

共 1 项评测

评测名称 / 模式

得分

排名/总数

AA-LCR

中

69.50

3 / 13

查看评测深度分析与其他模型对比

MiniMax M2.5

发布机构

MiniMaxAI

查看发布机构详情

MiniMax M2.5

模型解读

MiniMax M2.5是由稀宇科技（MiniMax）开发的一款大语言模型，于2026年2月12日正式上线。该模型激活参数量为10B，总参数量未公开，采用大规模强化学习训练，支持超过10种编程语言，包括Python、Java、JavaScript等。其设计重点在于为Agent场景提供生产级支持，强调在真实复杂环境中的应用。

模型能力方面，MiniMax M2.5在编程、工具调用、搜索和办公生产力场景中表现出色。在编程领域，它支持全栈开发，覆盖Web、Android、iOS等多平台，能够从系统设计到代码审查的全流程处理；在SWE-Bench Verified基准测试中得分80.2%，Multi-SWE-Bench得分51.3%。在工具调用和搜索方面，BrowseComp得分76.3%，优化了任务拆解和token消耗，相比上一代M2.1，完成任务速度提升37%。在办公场景中，它处理Word、PPT、Excel等高阶任务，在GDPval-MM评测中平均胜率59.0%。推理速度可达100 TPS，是部分主流模型的两倍左右。

外部评价显示，该模型在编程和Agentic性能上与Claude Opus 4.6相当，在某些基准测试中接近或超过国际顶尖水平。用户反馈指出，其在工具调用和响应速度上表现良好，但复杂任务处理可能需更精确提示。在BridgeBench基准中得分59.7%，略低于Claude Opus 4.6的60.1%，但成本更低。部分测试显示，长上下文召回平均96.7%，Agent任务总分提升42.8%。媒体报道称，其性价比高，适用于实际工作场景，但生成结果有时需进一步修改。

使用途径包括通过API接入，支持Anthropic API兼容模式，模型名为MiniMax-M2.5，可用于OpenClaw、Claude Code等工具。已在MiniMax Agent平台上线，支持全能模式和专家模式，可处理行业研究、金融建模等任务。定价分为两个版本：100 TPS版本输入0.3美元/百万token，输出2.4美元/百万token；50 TPS版本输出价格为前者的一半。连续运行一小时（100 token/s）成本1美元，（50 token/s）成本0.3美元，相当于部分国际模型的1/10至1/20。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

加载中...

MiniMax M2.5

发布时间: 2026-02-12更新于: 2026-03-29 10:29:03.6783,527

在线体验 GitHub Hugging Face Compare

模型参数

2290.0亿

上下文长度

128K

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

MiniMax M2.5

模型基本信息

推理过程

支持

思考模式

思考水平 · 开启 (On) (默认)思考水平 · 关闭 (Off)

上下文长度

128K tokens

最大输出长度

暂无数据

模型类型

推理大模型

发布时间

2026-02-12

模型文件大小

230GB

MoE架构

是

总参数 / 激活参数

2290.0 亿 / 100 亿

知识截止

暂无数据

MiniMax M2.5

开源和体验地址

代码开源状态

Modified MIT License

预训练权重开源

Modified MIT License- 免费商用授权

GitHub 源码

https://github.com/MiniMax-AI/MiniMax-M2.5

Hugging Face

https://huggingface.co/MiniMaxAI/MiniMax-M2.5

在线体验

https://agent.minimax.io/

MiniMax M2.5

官方介绍与博客

官方论文

MiniMax M2.5: Built for Real-World Productivity.

DataLearnerAI博客

暂无介绍博客

MiniMax M2.5

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

了解不同定价模式详解

标准模式

类型	适用条件	输入	输出
文本	-	$0.300/ 1M	$2.40/ 1M

加速模式

类型	适用条件	输入	输出
文本	-	$0.150/ 1M	$1.20/ 1M

MiniMax M2.5

评测结果

综合评估

共 2 项评测

评测名称 / 模式

得分

排名/总数

GPQA Diamond

中

85.20

34 / 162

HLE

中

19.40

72 / 119

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

SWE-bench Verified

开启工具

80.20

6 / 93

SWE-Bench Pro - Public

开启工具

55.40

7 / 22

数学推理

共 1 项评测

评测名称 / 模式

得分

排名/总数

AIME2025

中

86.30

48 / 107

Agent能力评测

共 2 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench - Telecom

开启工具

97.80

9 / 33

Pinch Bench

开启工具

87.80

6 / 37

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

IF Bench

开启工具

10 / 27

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp

开启工具

76.30

8 / 33

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

开启工具

51.70

14 / 28

生产力知识

共 1 项评测

评测名称 / 模式

得分

排名/总数

GDPval-AA

中

11 / 15

长上下文能力

共 1 项评测

评测名称 / 模式

得分

排名/总数

AA-LCR

中

69.50

3 / 13

查看评测深度分析与其他模型对比

MiniMax M2.5

发布机构

MiniMaxAI

查看发布机构详情

MiniMax M2.5

模型解读

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送