加载中...

MiniMax M2、Qwen3-235B-A22B-Thinking、DeepSeek V3.2-Exp等 4 款对比结果 - 参数、价格与评测分数 | DataLearnerAI

大模型评测对比结果

自动展示选中模型的核心信息与各评测得分，可左右滑动查看完整表格。当前对比 4 个模型的评测数据与核心参数。

MiniMax M2Qwen3-235B-A22B-ThinkingDeepSeek V3.2-ExpKimi K2 0905

规格对比

MiniMaxAI

MiniMax M2

MiniMax-M2

发布时间2025-10-27

上下文205K

参数量2300

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

查看详情在线体验

阿里巴巴

Qwen3-235B-A22B-Thinking

Qwen3-235B-A22B-Thinking-2507

发布时间2025-07-30

上下文256K

参数量305

思考模式（Thinking Mode）

查看详情在线体验

DeepSeek-AI

DeepSeek V3.2-Exp

DeepSeek-V3.2-Exp

发布时间2025-09-29

上下文128K

参数量6710

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

查看详情在线体验

Moonshot AI

Kimi K2 0905

Kimi K2-Instruct-0905

发布时间2025-09-05

上下文256K

参数量10000

常规模式（Non-Thinking Mode）

查看详情在线体验

性能评测对比

支持不同模式与工具的榜单对比。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

性能评测对比

支持不同模式与工具的榜单对比。

全部模式 · 去除并行

展示视图

Thinking 模式（默认）

Thinking 模式（默认） - Help

Default: Thinking 模式（默认） (Standard/Medium)
All: Thinking 模式（全部）

全部工具

并行

Best Overall

Qwen3-235B-A22B-Thinking · 68.92

Best Single

Qwen3-235B-A22B-Thinking · AIME2025 92.30

Thinking 模式（默认）

MiniMax M2 · 1 模态支持

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

筛选: 全部模式 · 去除并行4 全部模式 · 12 评测基准

图表加载中...

评测得分表格

完整列出各模型/模式的评测得分，便于横向比较。

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

12 评测基准4 全部模式

支持模式:常规思考深思工具并行

评测基准	MI MiniMax M2MiniMaxAI	QW Qwen3-235B-A22B-Thinking阿里巴巴	DE DeepSeek V3.2-ExpDeepSeek-AI	KI Kimi K2 0905Moonshot AI
评测基准
综合评估
GPQA Diamond	78.00	81.10	79.90	—
HLE	12.50	18.20	20.30	21.70
LiveBench	64.26	63.42	71.64	—
MMLU Pro	82.00	84.40	85.00	—
编程与软件工程
LiveCodeBench	83.00	74.10	74.10	—
SWE-bench Verified	69.40	—	67.80	69.20
数学推理
AIME2025	78.00	92.30	89.30	75.20
AI Agent - 工具使用
Terminal-Bench	24.00	—	37.70	44.50
Agent能力评测
τ²-Bench	77.20	—	66.70	—
τ²-Bench - Telecom	87.00	—	34.00	—
指令跟随
IF Bench	72.30	—	54.10	—
AI Agent - 信息收集
BrowseComp	44.00	—	40.10	—

其他能力

能力与规格明细

是否 MoE、商业授权、模态支持等附加能力对比。

功能与规格	MI MiniMax M2MiniMaxAI	QW Qwen3-235B-A22B-Thinking阿里巴巴	DE DeepSeek V3.2-ExpDeepSeek-AI	KI Kimi K2 0905Moonshot AI
模型信息卡片
开发机构	MiniMaxAI	阿里巴巴	DeepSeek-AI	Moonshot AI
模型全名	MiniMax-M2	Qwen3-235B-A22B-Thinking-2507	DeepSeek-V3.2-Exp	Kimi K2-Instruct-0905
模型简介	未提供	未提供	未提供	未提供
模型类型	聊天大模型	推理大模型	推理大模型	聊天大模型
模型代号	minimax-m2	Qwen3-235B-A22B-Thinking-2507	deepseek-v3-2-exp	kimi-k2-0905
发布时间	2025-10-27	2025-07-30	2025-09-29	2025-09-05
MoE 架构	支持	支持	支持	支持
规格与性能
上下文	205K	256K	128K	256K
参数量	2300	305	6710	10000
激活参数量	100	33	370	320
模型规模	100b	34b	100b	100b
模型大小	239.99 GB	31.17GB	1342GB	1.01TB
推理速度
推理等级
最大输出	未提供	16384	64000	4096
支持模式	常规模式（Non-Thinking Mode）思考模式（Thinking Mode）	思考模式（Thinking Mode）	常规模式（Non-Thinking Mode）思考模式（Thinking Mode）	常规模式（Non-Thinking Mode）
开源与许可
代码开源	未开源	未提供	未开源	未开源
权重开源	未开源	未提供	未开源	未开源
商业授权	免费商用授权	免费商用授权	免费商用授权	免费商用授权
模态支持
文本输入/输出	/	/	/	/
图片输入/输出	/	/	/	/
音频输入/输出	/	/	/	/
视频输入/输出	/	/	/	/
Embedding 输入/输出	/	/	/	/
API 接口详情
文本价格	输入: 0.3 美元/100万tokens输出: 1.2 美元/100万tokens	输入: 0.2 美元/100 万tokens输出: 2.4 美元/100 万tokens	输入: 0.28 美元 / 100万 tokens输出: 0.42 美元 / 100万 tokensCache: 0.028 美元 / 100万 tokens	输入: 0.60 美元/ 100 万tokens输出: 2.5 美元/ 100 万tokens
图片 API 价格	未提供	未提供	未提供	未提供
音频 API 价格	未提供	未提供	未提供	未提供
视频 API 价格	未提供	未提供	未提供	未提供
Embedding API 价格	未提供	未提供	未提供	未提供
资源与链接
GitHub	仓库	仓库	仓库	未提供
Hugging Face	模型页	模型页	模型页	模型页
官方页面	未提供	未提供	未提供	未提供
实用指南	未提供	未提供	未提供	未提供
论文/报告		Qwen3: Think Deeper, Act Faster	DeepSeek-V3.2-Exp: Boosting Long-Context Efficiency with DeepSeek Sparse Attention
DataLearnerAI	MiniMaxAI开源MiniMax M2模型：Artificial Analysis评测显示综合智能得分超过Claude Opus 4.1，开源第一，全球第五。	未提供	未提供	Moonshot AI发布Kimi K2-Instruct-0905：256K上下文长度加持，全面升级的开放式智能体模型

API 价格

API 价格对比

输入输出 token 价格并排展示

Loading comparison...

大模型评测对比结果

自动展示选中模型的核心信息与各评测得分，可左右滑动查看完整表格。当前对比 4 个模型的评测数据与核心参数。

MiniMax M2Qwen3-235B-A22B-ThinkingDeepSeek V3.2-ExpKimi K2 0905

规格对比

MiniMaxAI

MiniMax M2

MiniMax-M2

发布时间2025-10-27

上下文205K

参数量2300

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

查看详情在线体验

阿里巴巴

Qwen3-235B-A22B-Thinking

Qwen3-235B-A22B-Thinking-2507

发布时间2025-07-30

上下文256K

参数量305

思考模式（Thinking Mode）

查看详情在线体验

DeepSeek-AI

DeepSeek V3.2-Exp

DeepSeek-V3.2-Exp

发布时间2025-09-29

上下文128K

参数量6710

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）

查看详情在线体验

Moonshot AI

Kimi K2 0905

Kimi K2-Instruct-0905

发布时间2025-09-05

上下文256K

参数量10000

常规模式（Non-Thinking Mode）

查看详情在线体验

性能评测对比

支持不同模式与工具的榜单对比。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

性能评测对比

支持不同模式与工具的榜单对比。

全部模式 · 去除并行

展示视图

Thinking 模式（默认）

Thinking 模式（默认） - Help

Default: Thinking 模式（默认） (Standard/Medium)
All: Thinking 模式（全部）

全部工具

并行

Best Overall

Qwen3-235B-A22B-Thinking · 68.92

Best Single

Qwen3-235B-A22B-Thinking · AIME2025 92.30

Thinking 模式（默认）

MiniMax M2 · 1 模态支持

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

筛选: 全部模式 · 去除并行4 全部模式 · 12 评测基准

图表加载中...

评测得分表格

完整列出各模型/模式的评测得分，便于横向比较。

评测得分对比

模型数据收集自官网、Artificial Analysis等页面

12 评测基准4 全部模式

支持模式:常规思考深思工具并行

评测基准	MI MiniMax M2MiniMaxAI	QW Qwen3-235B-A22B-Thinking阿里巴巴	DE DeepSeek V3.2-ExpDeepSeek-AI	KI Kimi K2 0905Moonshot AI
评测基准
综合评估
GPQA Diamond	78.00	81.10	79.90	—
HLE	12.50	18.20	20.30	21.70
LiveBench	64.26	63.42	71.64	—
MMLU Pro	82.00	84.40	85.00	—
编程与软件工程
LiveCodeBench	83.00	74.10	74.10	—
SWE-bench Verified	69.40	—	67.80	69.20
数学推理
AIME2025	78.00	92.30	89.30	75.20
AI Agent - 工具使用
Terminal-Bench	24.00	—	37.70	44.50
Agent能力评测
τ²-Bench	77.20	—	66.70	—
τ²-Bench - Telecom	87.00	—	34.00	—
指令跟随
IF Bench	72.30	—	54.10	—
AI Agent - 信息收集
BrowseComp	44.00	—	40.10	—

其他能力

能力与规格明细

是否 MoE、商业授权、模态支持等附加能力对比。

功能与规格	MI MiniMax M2MiniMaxAI	QW Qwen3-235B-A22B-Thinking阿里巴巴	DE DeepSeek V3.2-ExpDeepSeek-AI	KI Kimi K2 0905Moonshot AI
模型信息卡片
开发机构	MiniMaxAI	阿里巴巴	DeepSeek-AI	Moonshot AI
模型全名	MiniMax-M2	Qwen3-235B-A22B-Thinking-2507	DeepSeek-V3.2-Exp	Kimi K2-Instruct-0905
模型简介	未提供	未提供	未提供	未提供
模型类型	聊天大模型	推理大模型	推理大模型	聊天大模型
模型代号	minimax-m2	Qwen3-235B-A22B-Thinking-2507	deepseek-v3-2-exp	kimi-k2-0905
发布时间	2025-10-27	2025-07-30	2025-09-29	2025-09-05
MoE 架构	支持	支持	支持	支持
规格与性能
上下文	205K	256K	128K	256K
参数量	2300	305	6710	10000
激活参数量	100	33	370	320
模型规模	100b	34b	100b	100b
模型大小	239.99 GB	31.17GB	1342GB	1.01TB
推理速度
推理等级
最大输出	未提供	16384	64000	4096
支持模式	常规模式（Non-Thinking Mode）思考模式（Thinking Mode）	思考模式（Thinking Mode）	常规模式（Non-Thinking Mode）思考模式（Thinking Mode）	常规模式（Non-Thinking Mode）
开源与许可
代码开源	未开源	未提供	未开源	未开源
权重开源	未开源	未提供	未开源	未开源
商业授权	免费商用授权	免费商用授权	免费商用授权	免费商用授权
模态支持
文本输入/输出	/	/	/	/
图片输入/输出	/	/	/	/
音频输入/输出	/	/	/	/
视频输入/输出	/	/	/	/
Embedding 输入/输出	/	/	/	/
API 接口详情
文本价格	输入: 0.3 美元/100万tokens输出: 1.2 美元/100万tokens	输入: 0.2 美元/100 万tokens输出: 2.4 美元/100 万tokens	输入: 0.28 美元 / 100万 tokens输出: 0.42 美元 / 100万 tokensCache: 0.028 美元 / 100万 tokens	输入: 0.60 美元/ 100 万tokens输出: 2.5 美元/ 100 万tokens
图片 API 价格	未提供	未提供	未提供	未提供
音频 API 价格	未提供	未提供	未提供	未提供
视频 API 价格	未提供	未提供	未提供	未提供
Embedding API 价格	未提供	未提供	未提供	未提供
资源与链接
GitHub	仓库	仓库	仓库	未提供
Hugging Face	模型页	模型页	模型页	模型页
官方页面	未提供	未提供	未提供	未提供
实用指南	未提供	未提供	未提供	未提供
论文/报告		Qwen3: Think Deeper, Act Faster	DeepSeek-V3.2-Exp: Boosting Long-Context Efficiency with DeepSeek Sparse Attention
DataLearnerAI	MiniMaxAI开源MiniMax M2模型：Artificial Analysis评测显示综合智能得分超过Claude Opus 4.1，开源第一，全球第五。	未提供	未提供	Moonshot AI发布Kimi K2-Instruct-0905：256K上下文长度加持，全面升级的开放式智能体模型

API 价格

API 价格对比

输入输出 token 价格并排展示

MiniMax M2

Qwen3-235B-A22B-Thinking

DeepSeek V3.2-Exp

Kimi K2 0905

性能评测对比

评测得分对比

评测得分表格

评测得分对比

能力与规格明细

模型信息卡片

规格与性能

开源与许可

模态支持

API 接口详情

资源与链接

API 价格对比

MiniMax M2

Qwen3-235B-A22B-Thinking

DeepSeek V3.2-Exp

Kimi K2 0905

性能评测对比

评测得分对比

评测得分表格

评测得分对比

能力与规格明细

模型信息卡片

规格与性能

开源与许可

模态支持

API 接口详情

资源与链接

API 价格对比