QW

Qwen3.6-35B-A3B

推理大模型

Qwen3.6-35B-A3B (MoE 架构, 35B 总参数, 3B 激活参数)

发布时间: 2026-04-1651

在线体验 GitHub Hugging Face Compare

模型参数

350.0亿

上下文长度

200K

中文支持

支持

推理能力

Qwen3.6-35B-A3B (MoE 架构, 35B 总参数, 3B 激活参数) 是由阿里巴巴发布的 AI 模型，发布时间为 2026-04-16，定位为推理大模型，参数规模约为 350.0B，上下文长度为 200K，采用 Apache 2.0 许可。

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen3.6-35B-A3B

模型基本信息

推理过程

支持

思考模式

不支持思考模式

上下文长度

200K tokens

最大输出长度

80000 tokens

模型类型

推理大模型

发布时间

2026-04-16

模型文件大小

暂无数据

MoE架构

是

总参数 / 激活参数

350.0 亿 / 30 亿

知识截止

暂无数据

Qwen3.6-35B-A3B

开源和体验地址

代码开源状态

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen3

Hugging Face

https://huggingface.co/Qwen/Qwen3.6-35B-A3B

在线体验

https://chat.qwen.ai

Qwen3.6-35B-A3B

官方介绍与博客

官方论文

Qwen3.6-35B-A3B：智能体编程利器，现已开源

DataLearnerAI博客

暂无介绍博客

Qwen3.6-35B-A3B

API接口信息

接口速度

4/5

暂无公开的 API 定价信息。

Qwen3.6-35B-A3B

评测结果

Qwen3.6-35B-A3B 当前已收录的代表性评测结果包括 GPQA（1 / 14，得分 86）、MMLU Pro（16 / 117，得分 85.20）、LiveCodeBench（20 / 109，得分 80.40）。本页还汇总了参数规模、上下文长度与 API 价格，便于结合评测结果与部署约束一起判断模型适配度。

综合评估

共 4 项评测

评测名称 / 模式

得分

排名/总数

开启

90

6 / 6

开启

86

1 / 14

开启

85.20

16 / 117

开启

21.40

75 / 131

编程与软件工程

共 4 项评测

评测名称 / 模式

得分

排名/总数

开启

80.40

20 / 109

SWE-bench Verified

开启

73.40

31 / 96

SWE-bench Multilingual

开启

67.20

7 / 9

SWE-Bench Pro - Public

开启

49.50

17 / 26

AI Agent - 工具使用

共 2 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0

开启

51.50

19 / 33

开启

26.90

6 / 6

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

开启

92.70

5 / 12

IMO-AnswerBench

开启

78.90

9 / 9

查看评测深度分析与其他模型对比

Qwen3.6-35B-A3B

发布机构

阿里巴巴

查看发布机构详情

Qwen3.6-35B-A3B (MoE 架构, 35B 总参数, 3B 激活参数)

模型解读

Qwen3.6-35B-A3B 是阿里云通义实验室于 2026 年 4 月 16 日发布并开源的新一代大型语言模型，属于 Qwen3.6 系列中的高效稀疏混合专家（MoE）模型[reference:2]。

模型概览与核心定位

Qwen3.6-35B-A3B 采用 MoE 架构，拥有 350 亿总参数，但在每次推理时仅需激活 30 亿参数[reference:3]。此设计使其在显著降低计算成本与推理延迟的同时，仍能保持强大的性能表现[reference:4]。该模型的核心定位是作为一款“智能体编程利器”，在智能体（Agentic）编程任务上表现卓越，大幅超越其前代 Qwen3.5-35B-A3B，并可与更大体量的稠密模型（如 Qwen3.5-27B、Gemma-31B）相媲美[reference:5]。作为一款原生多模态模型，它支持图文、文档分析及空间智能等多种任务，延续了“思考/非思考”双模式，是当时最具通用性的开源模型之一[reference:6]。

架构与技术规格

模型参数：总参数量 350 亿（35B），激活参数量 30 亿（3B）[reference:7]。
上下文窗口：原生支持 200K tokens 上下文，部分任务评测中使用了 256K 上下文配置[reference:8][reference:9]。
架构特点：采用稀疏混合专家（MoE）架构，以较低的激活参数和计算成本实现高效推理[reference:10]。

核心能力与支持模态

模态支持：原生支持多模态（图文、空间智能等）[reference:11]。
能力详述：
- 卓越的智能体编程能力：在 SWE-bench Verified (73.4)、SWE-bench Multilingual (67.2)、Terminal-Bench 2.0 (51.5) 等编程基准上表现突出，超越前代模型[reference:12]。
- 强大的多模态感知与推理：在视觉语言任务中表现优异，RefCOCO 得分 92.0、ODInW13 得分 50.8，在多数基准上与 Claude Sonnet 4.5 持平甚至超越[reference:13]。
- 混合思考能力：支持思考（Thinking）与非思考（Non-Thinking）两种模式，可根据任务复杂度灵活切换[reference:14]。

性能与基准评测

官方公布的部分基准测试得分如下：

自然语言与编程：MMLU-Pro (85.2)[reference:15], GPQA (86.0)[reference:16], LiveCodeBench v6 (80.4)[reference:17], SkillsBench Avg5 (28.7)[reference:18]。
多模态与视觉：MMMU (81.7)[reference:19], MMMU-Pro (75.3)[reference:20], Mathvista(mini) (86.4)[reference:21]。

应用场景与限制

推荐用例：智能体编程、多模态内容理解与生成、空间智能任务、代码生成、需要复杂推理的任务[reference:22]。
已知局限：官方在发布时未明确列出具体限制。模型虽支持长上下文，但最大输出长度约为 80K tokens[reference:23]。

访问方式与许可

模型权重：完全开源，可通过 Hugging Face 和 ModelScope 下载[reference:24]。
在线体验：可在 Qwen Studio 进行交互对话[reference:25]。
API 调用：即将通过阿里云百炼平台以 qwen3.6-flash 的名称提供 API 服务[reference:26]。
许可证：Apache 2.0[reference:27]。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

DataLearner 官方微信二维码