模型评测对比 最新基准汇总

Qwen3-30B-A3B-2507与Qwen3-30B-A3B、Qwen3-32B、Qwen3-235B-A22B模型对比

本页面提供Qwen3-30B-A3B-2507,Qwen3-30B-A3B,Qwen3-32B,Qwen3-235B-A22B模型的对比,包括参数、开源情况、API价格等。同时,页面也会展示Qwen3-30B-A3B-2507,Qwen3-30B-A3B,Qwen3-32B,Qwen3-235B-A22B模型在MMLU Pro,GPQA Diamond,AIME2025,Creative Writing等评测基准中的详细对比数据,评测数据来自系统收录结果汇总。
📊 左右滑动可查看更多模型数据 →
Qwen3-30B-A3B-2507
Qwen3-30B-A3B-2507

阿里巴巴 发布的聊天大模型模型。

核心信息
开发机构 阿里巴巴 阿里巴巴
发布时间 2025-07-29
模型类型 聊天大模型
MoE 架构
性能与规格
总参数量 305 亿
激活参数量 33 亿
模型大小
推理能力
推理速度
思考模式
深度思考
最大上下文 256K
最大输出 16384
支持模态
T T
Input
Output
开源与许可
开源与许可
代码开源 --
权重开源 --
商业用途 免费商用授权
相关资源
论文/报告
模型详细介绍 --
相关链接 🤗
Qwen3-30B-A3B
Qwen3-30B-A3B

阿里巴巴 发布的推理大模型模型。

核心信息
开发机构 阿里巴巴 阿里巴巴
发布时间 2025-04-28
模型类型 推理大模型
MoE 架构
性能与规格
总参数量 305 亿
激活参数量 33 亿
模型大小 61.09 GB
推理能力
推理速度
思考模式
深度思考
最大上下文 128K
最大输出 16384
支持模态
T T
Input
Output
开源与许可
开源与许可
代码开源 --
权重开源 --
商业用途 免费商用授权
相关资源
论文/报告 查看
模型详细介绍 阅读
相关链接 🤗
Qwen3-32B
Qwen3-32B

阿里巴巴 发布的推理大模型模型。

核心信息
开发机构 阿里巴巴 阿里巴巴
发布时间 2025-04-28
模型类型 推理大模型
MoE 架构
性能与规格
总参数量 320 亿
激活参数量 320 亿
模型大小 64GB
推理能力
推理速度
思考模式
深度思考
最大上下文 128K
最大输出 16384
支持模态
T T
Input
Output
开源与许可
开源与许可
代码开源 --
权重开源 --
商业用途 免费商用授权
相关资源
论文/报告 查看
模型详细介绍 阅读
相关链接 🤗
Qwen3-235B-A22B
Qwen3-235B-A22B

阿里巴巴 发布的推理大模型模型。

核心信息
开发机构 阿里巴巴 阿里巴巴
发布时间 2025-04-28
模型类型 推理大模型
MoE 架构
性能与规格
总参数量 2,350 亿
激活参数量 220 亿
模型大小 470GB
推理能力
推理速度
思考模式
深度思考
最大上下文 128K
最大输出 16384
支持模态
T T
Input
Output
开源与许可
开源与许可
代码开源 --
权重开源 --
商业用途 免费商用授权
相关资源
论文/报告 查看
模型详细介绍 阅读
相关链接 🤗
评测对比模式筛选
当前大多数模型的评测都有不同的模式,包括是否使用推理过程,是否使用工具等,建议选择特定模式对比。 点击下方任一按钮,将 过滤模型的模式的对比表格,并同步更新 汇总图各基准小图
快捷组合
思考模式

说明:Thinking(默认)在检测到 low / medium / high 子模式时只保留 medium 版本,点击 Thinking(全部)可查看所有子模式。

工具使用

Qwen3-30B-A3B-2507与Qwen3-30B-A3B、Qwen3-32B、Qwen3-235B-A22B模型各评测基准得分对比表

评测基准
Qwen3-30B-A3B-2507 normal
Qwen3-30B-A3B normal
Qwen3-32B normal
Qwen3-32B thinking
Qwen3-235B-A22B normal
Qwen3-235B-A22B thinking
MMLU Pro
综合评估
78.4 69.1 -- -- 72.9 --
GPQA Diamond
综合评估
70.4 54.8 53.3 68.4 71.1 71.1
AIME2025
数学推理
61.3 21.6 72.9 72.9 24.7 81.5
Creative Writing
写作和创作
86 68.1 -- 81 80.4 84.6

Qwen3-30B-A3B-2507与Qwen3-30B-A3B、Qwen3-32B、Qwen3-235B-A22B模型评测结果汇总对比图

蓝色柱状系列表示选定模型 Qwen3-30B-A3B-2507 在不同模式下的表现

Qwen3-30B-A3B-2507与Qwen3-30B-A3B、Qwen3-32B、Qwen3-235B-A22B模型的API价格对比图 (文本输入/输出)

Qwen3-30B-A3B-2507与Qwen3-30B-A3B、Qwen3-32B、Qwen3-235B-A22B模型在各评测基准详细对比