Qw

Qwen3-30B-A3B

推理大模型

Qwen3-30B-A3B

发布时间: 2025-04-28

1,208
模型参数(Parameters)
305.0
最高上下文长度(Context Length)
128K
是否支持中文
支持
推理能力(Reasoning)

模型基本信息

是否支持推理过程

支持

最高上下文输入长度

128K tokens

最长输出结果

16384 tokens

模型类型

推理大模型

发布时间

2025-04-28

模型预文件大小

61.09 GB

推理模式
常规模式(Non-Thinking Mode) 思考模式(Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0 - 免费商用授权
GitHub 源码
Hugging Face
在线体验
暂无在线体验地址

API接口信息

接口速度(满分5分)
接口价格

默认单位:$/100万 tokens;若计费单位不同,则以供应商公开的原始标注为准。

标准计费 Standard
模态 输入 输出
文本 0.2 美元/100 万tokens 0.8 美元/100 万tokens

Qwen3-30B-A3B模型在各大评测榜单的评分

综合评估

共 3 项评测
MMLU Pro normal
69.10
71 / 105
LiveBench normal
57.80
46 / 48
GPQA Diamond normal
54.80
102 / 133

编程与软件工程

共 1 项评测
LiveCodeBench normal
29
92 / 94

数学推理

共 1 项评测
AIME2025 normal
21.60
91 / 93

写作和创作

共 1 项评测
68.10
21 / 22

发布机构

Qwen3-30B-A3B模型解读

Qwen3-30B-A3B是阿里开源的第三代千问大模型中的MoE架构版本的模型,参数300亿,每次推理激活其中的30亿参数。


2025年7月29日,阿里发布了这个模型的更新版本,仅支持非推理模式的Qwen3-30B-A3B-Instruct-2507,但是各方面能力提升明显。

关注DataLearnerAI公众号

关注DataLearnerAI微信公众号,接受最新大模型资讯

DataLearnerAI WeChat