Qwen3-30B-A3B-2507大模型评测基准与性能对比
本页面提供了Qwen3-30B-A3B-2507,Qwen3-30B-A3B,Qwen3-32B,Qwen3-235B-A22B模型在MMLU Pro,GPQA Diamond,AIME2025,Creative Writing等评测基准中的详细对比数据,评测数据来源当前系统收录结果生成。数据如有问题可以通过微信公众号联系更正,感谢!
主要模型核心信息对比
对比项 | Qwen3-30B-A3B-2507 | Qwen3-30B-A3B | Qwen3-32B | Qwen3-235B-A22B |
---|---|---|---|---|
参数量/规模 | 305 亿 | 305 亿 | 320 亿 | 2,350 亿 |
开发/发布机构 | ||||
发布时间 | 2025-07-29 | 2025-04-28 | 2025-04-28 | 2025-04-28 |
最大上下文 | 256K | 128K | 128K | 128K |
最大输出 | 16384 | 16384 | 16384 | 16384 |
开源/闭源 | 免费商用授权 | 免费商用授权 | 免费商用授权 | 免费商用授权 |
输入价格 | 0.2 美元/100 万tokens | 0.2 美元/100 万tokens | 0.7 美元/100 万tokens | 0.7 美元/100 万tokens |
输出价格 | 0.8 美元/100 万tokens | 0.8 美元/100 万tokens | 2.8 美元/100 万tokens | 8.4 美元/100 万tokens |
论文/报告 | 查看论文 | 查看论文 | 查看论文 | |
在线体验 | 立即体验 | -- | 立即体验 | 立即体验 |
Qwen3-30B-A3B-2507模型与主流模型各评测基准得分对比表
评测基准 | Qwen3-30B-A3B-2507
normal |
Qwen3-30B-A3B
normal |
Qwen3-32B
normal |
Qwen3-32B thinking |
Qwen3-235B-A22B
normal |
Qwen3-235B-A22B thinking |
---|---|---|---|---|---|---|
MMLU Pro
知识问答
|
78.4 | 69.1 | 0 | 0 | 72.9 | 0 |
GPQA Diamond
常识推理
|
70.4 | 54.8 | 53.3 | 68.4 | 71.1 | 71.1 |
AIME2025
数学推理
|
61.3 | 21.6 | 72.9 | 72.9 | 24.7 | 81.5 |
Creative Writing
知识问答
|
86 | 68.1 | 0 | 81 | 80.4 | 84.6 |