MiniMax M2 评测详情

MiniMax M2 当前已收录的代表性评测结果包括 LiveCodeBench(23 / 120,得分 83)、IF Bench(9 / 29,得分 72.30)、MMLU Pro(50 / 126,得分 82)。

评测结果

MiniMax M2

评测结果

思考模式

综合评估

共 3 项评测
评测名称 / 模式
得分
排名/总数
82
50 / 126
78
84 / 179
12.50
129 / 161

编程与软件工程

共 2 项评测
评测名称 / 模式
得分
排名/总数
83
23 / 120
69.40
58 / 108

数学推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
78
60 / 106

AI Agent - 工具使用

共 1 项评测
评测名称 / 模式
得分
排名/总数

常识推理

共 1 项评测
评测名称 / 模式
得分
排名/总数
Simple Bench
常规模式
25
54 / 63

Agent能力评测

共 2 项评测
评测名称 / 模式
得分
排名/总数
77.20
18 / 40

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
72.30
9 / 29

AI Agent - 信息收集

共 1 项评测
评测名称 / 模式
得分
排名/总数
44
40 / 46