Qwen3-30B-A3B-2507大模型评测基准与性能对比

本页面提供了Qwen3-30B-A3B-2507,Qwen3-30B-A3B,Qwen3-32B,Qwen3-235B-A22B模型在MMLU Pro,GPQA Diamond,AIME2025,Creative Writing等评测基准中的详细对比数据,评测数据来源当前系统收录结果生成。数据如有问题可以通过微信公众号联系更正,感谢!

主要模型核心信息对比

对比项 Qwen3-30B-A3B-2507 Qwen3-30B-A3B Qwen3-32B Qwen3-235B-A22B
参数量/规模 305 亿 305 亿 320 亿 2,350 亿
开发/发布机构
发布时间 2025-07-29 2025-04-28 2025-04-28 2025-04-28
最大上下文 256K 128K 128K 128K
最大输出 16384 16384 16384 16384
开源/闭源 免费商用授权 免费商用授权 免费商用授权 免费商用授权
输入价格 0.2 美元/100 万tokens 0.2 美元/100 万tokens 0.7 美元/100 万tokens 0.7 美元/100 万tokens
输出价格 0.8 美元/100 万tokens 0.8 美元/100 万tokens 2.8 美元/100 万tokens 8.4 美元/100 万tokens
论文/报告 查看论文 查看论文 查看论文
在线体验 立即体验 -- 立即体验 立即体验

Qwen3-30B-A3B-2507模型与主流模型各评测基准得分对比表

评测基准 Qwen3-30B-A3B-2507
normal
Qwen3-30B-A3B
normal
Qwen3-32B
normal
Qwen3-32B
thinking
Qwen3-235B-A22B
normal
Qwen3-235B-A22B
thinking
MMLU Pro
知识问答
78.4 69.1 0 0 72.9 0
GPQA Diamond
常识推理
70.4 54.8 53.3 68.4 71.1 71.1
AIME2025
数学推理
61.3 21.6 72.9 72.9 24.7 81.5
Creative Writing
知识问答
86 68.1 0 81 80.4 84.6

Qwen3-30B-A3B-2507模型与其它模型评测结果汇总对比图

Qwen3-30B-A3B-2507模型与其它模型的API价格对比图 (文本输入/输出)

Qwen3-30B-A3B-2507模型在各评测基准详细对比