DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
目录
大模型列表Qwen3.6-35B-A3B
QW

Qwen3.6-35B-A3B

推理大模型

Qwen3.6-35B-A3B (MoE 架构, 35B 总参数, 3B 激活参数)

发布时间: 2026-04-1651
在线体验GitHubHugging FaceCompare
模型参数
350.0亿
上下文长度
200K
中文支持
支持
推理能力

Qwen3.6-35B-A3B (MoE 架构, 35B 总参数, 3B 激活参数) 是由 阿里巴巴 发布的 AI 模型,发布时间为 2026-04-16,定位为 推理大模型,参数规模约为 350.0B,上下文长度为 200K,采用 Apache 2.0 许可。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Qwen3.6-35B-A3B

模型基本信息

推理过程
支持
思考模式
不支持思考模式
上下文长度
200K tokens
最大输出长度
80000 tokens
模型类型
推理大模型
发布时间
2026-04-16
模型文件大小
暂无数据
MoE架构
是
总参数 / 激活参数
350.0 亿 / 30 亿
知识截止
暂无数据
Qwen3.6-35B-A3B

开源和体验地址

代码开源状态
Apache 2.0
预训练权重开源
Apache 2.0- 免费商用授权
GitHub 源码
https://github.com/QwenLM/Qwen3
Hugging Face
https://huggingface.co/Qwen/Qwen3.6-35B-A3B
在线体验
https://chat.qwen.ai
Qwen3.6-35B-A3B

官方介绍与博客

官方论文
Qwen3.6-35B-A3B:智能体编程利器,现已开源
DataLearnerAI博客
暂无介绍博客
Qwen3.6-35B-A3B

API接口信息

接口速度
4/5
暂无公开的 API 定价信息。
Qwen3.6-35B-A3B

评测结果

Qwen3.6-35B-A3B 当前已收录的代表性评测结果包括 GPQA(1 / 14,得分 86)、MMLU Pro(16 / 117,得分 85.20)、LiveCodeBench(20 / 109,得分 80.40)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
全部思考

综合评估

共 4 项评测
评测名称 / 模式
得分
排名/总数
C-Eval
开启
90
6 / 6
GPQA
开启
86
1 / 14
MMLU Pro
开启
85.20
16 / 117
HLE
开启
21.40
75 / 131

编程与软件工程

共 4 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
开启
80.40
20 / 109
SWE-bench Verified
开启
73.40
31 / 96
SWE-bench Multilingual
开启
67.20
7 / 9
SWE-Bench Pro - Public
开启
49.50
17 / 26

AI Agent - 工具使用

共 2 项评测
评测名称 / 模式
得分
排名/总数
Terminal Bench 2.0
开启
51.50
19 / 33
Tool Decathlon
开启
26.90
6 / 6

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
AIME 2026
开启
92.70
5 / 12
IMO-AnswerBench
开启
78.90
9 / 9
查看评测深度分析与其他模型对比
Qwen3.6-35B-A3B

发布机构

阿里巴巴
阿里巴巴
查看发布机构详情
Qwen3.6-35B-A3B (MoE 架构, 35B 总参数, 3B 激活参数)

模型解读

Qwen3.6-35B-A3B 是阿里云通义实验室于 2026 年 4 月 16 日发布并开源的新一代大型语言模型,属于 Qwen3.6 系列中的高效稀疏混合专家(MoE)模型[reference:2]。

模型概览与核心定位

Qwen3.6-35B-A3B 采用 MoE 架构,拥有 350 亿总参数,但在每次推理时仅需激活 30 亿参数[reference:3]。此设计使其在显著降低计算成本与推理延迟的同时,仍能保持强大的性能表现[reference:4]。该模型的核心定位是作为一款“智能体编程利器”,在智能体(Agentic)编程任务上表现卓越,大幅超越其前代 Qwen3.5-35B-A3B,并可与更大体量的稠密模型(如 Qwen3.5-27B、Gemma-31B)相媲美[reference:5]。作为一款原生多模态模型,它支持图文、文档分析及空间智能等多种任务,延续了“思考/非思考”双模式,是当时最具通用性的开源模型之一[reference:6]。

架构与技术规格

  • 模型参数:总参数量 350 亿(35B),激活参数量 30 亿(3B)[reference:7]。
  • 上下文窗口:原生支持 200K tokens 上下文,部分任务评测中使用了 256K 上下文配置[reference:8][reference:9]。
  • 架构特点:采用稀疏混合专家(MoE)架构,以较低的激活参数和计算成本实现高效推理[reference:10]。

核心能力与支持模态

  • 模态支持:原生支持多模态(图文、空间智能等)[reference:11]。
  • 能力详述:
    • 卓越的智能体编程能力:在 SWE-bench Verified (73.4)、SWE-bench Multilingual (67.2)、Terminal-Bench 2.0 (51.5) 等编程基准上表现突出,超越前代模型[reference:12]。
    • 强大的多模态感知与推理:在视觉语言任务中表现优异,RefCOCO 得分 92.0、ODInW13 得分 50.8,在多数基准上与 Claude Sonnet 4.5 持平甚至超越[reference:13]。
    • 混合思考能力:支持思考(Thinking)与非思考(Non-Thinking)两种模式,可根据任务复杂度灵活切换[reference:14]。

性能与基准评测

官方公布的部分基准测试得分如下:

  • 自然语言与编程:MMLU-Pro (85.2)[reference:15], GPQA (86.0)[reference:16], LiveCodeBench v6 (80.4)[reference:17], SkillsBench Avg5 (28.7)[reference:18]。
  • 多模态与视觉:MMMU (81.7)[reference:19], MMMU-Pro (75.3)[reference:20], Mathvista(mini) (86.4)[reference:21]。

应用场景与限制

  • 推荐用例:智能体编程、多模态内容理解与生成、空间智能任务、代码生成、需要复杂推理的任务[reference:22]。
  • 已知局限:官方在发布时未明确列出具体限制。模型虽支持长上下文,但最大输出长度约为 80K tokens[reference:23]。

访问方式与许可

  • 模型权重:完全开源,可通过 Hugging Face 和 ModelScope 下载[reference:24]。
  • 在线体验:可在 Qwen Studio 进行交互对话[reference:25]。
  • API 调用:即将通过阿里云百炼平台以 qwen3.6-flash 的名称提供 API 服务[reference:26]。
  • 许可证:Apache 2.0[reference:27]。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码