加载中...

Qwen3.5-397B-A17B

Name: Qwen3.5-397B-A17B
Availability: InStock
Author: 阿里巴巴

发布时间: 2026-02-16更新于: 2026-02-16 19:02:35.478103

在线体验 GitHub Hugging Face Compare

模型参数

397.0亿

上下文长度

256K

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen3.5-397B-A17B

模型基本信息

推理过程

支持

上下文长度

256K tokens

最大输出长度

暂无数据

模型类型

多模态大模型

发布时间

2026-02-16

模型文件大小

暂无数据

MoE架构

是

总参数 / 激活参数

397.0 亿 / 17 亿

知识截止

暂无数据

推理模式

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）深度思考（Deeper Thinking Mode）

Qwen3.5-397B-A17B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen3.5

Hugging Face

https://huggingface.co/Qwen/Qwen3.5-397B-A17B

在线体验

https://chat.qwen.ai

Qwen3.5-397B-A17B

官方介绍与博客

官方论文

Qwen3.5: Towards Native Multimodal Agents

DataLearnerAI博客

暂无介绍博客

Qwen3.5-397B-A17B

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	0.6	3.6

Qwen3.5-397B-A17B

评测得分

综合评估

共 5 项评测

评测名称 / 模式

得分

排名/总数

C-Eval思考

2 / 3

GPQA Diamond思考

88.40

10 / 150

MMLU Pro思考

87.80

7 / 112

HLE思考 + 使用工具

48.30

9 / 99

HLE思考

28.70

35 / 99

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench思考 + 使用工具

83.60

10 / 103

SWE-bench Verified思考

76.40

13 / 85

Agent能力评测

共 1 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench思考 + 使用工具

86.70

5 / 35

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

IF Bench思考 + 使用工具

76.50

1 / 23

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp思考 + 使用工具

9 / 25

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0思考 + 使用工具

52.50

7 / 18

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

AIME 2026思考

91.30

6 / 7

IMO-AnswerBench思考

80.90

6 / 6

长上下文能力

共 1 项评测

评测名称 / 模式

得分

排名/总数

AA-LCR思考

68.70

3 / 6

查看评测深度分析与其他模型对比

Qwen3.5-397B-A17B

发布机构

阿里巴巴

查看发布机构详情

Qwen3.5-397B-A17B

模型解读

Qwen3.5-397B-A17B模型由阿里巴巴云的Qwen团队开发，于2026年2月16日发布，作为Qwen3.5系列的首个开源权重模型。该模型作为原生视觉-语言基础模型，针对多模态代理应用的进步。

在架构和技术规格方面，它采用混合设计，将通过Gated Delta Networks的线性注意力与稀疏专家混合（MoE）结构集成，导致总参数量为3970亿，每次前向传递激活参数为170亿。上下文窗口扩展至256,000个token，便于处理推理和多模态任务中的扩展序列。预训练涉及大规模视觉-文本token，数据在中文和英文、多语言内容、STEM领域和推理元素方面丰富，并经过严格过滤。

关于核心能力和模态，该模型原生支持文本、图像和视频输入，同时生成文本输出。它在多模态推理方面表现出色，包括视觉理解、空间智能、视频分析、语言理解、代码生成以及代理工作流与工具集成，如网络搜索和代码解释器。

在性能指标上，该模型在MMLU-Pro上获得87.8分，MMLU-Redux上94.9分，SuperGPQA上70.4分，MMMU上85.0分，MMMU-Pro上79.0分，MathVision上88.6分，RealWorldQA上83.9分，VideoMME上87.5分，以及MVBench上77.6分。在比较中，它在知识、推理和编码基准上优于GLM-4.5-355B-A32B和DeepSeek-V3.2-671B-A37B等模型，同时相对于Qwen3-Max在32k和256k上下文中提供8.6x至19.0x更高的解码吞吐量，相对于Qwen3-235B-A22B提供3.5x至7.2x。

对于应用场景，它适用于自治代理系统、视觉推理、编码协助和GUI自动化。已知限制包括在超长视频处理或训练数据未覆盖的高度专业化领域中的潜在约束。

访问通过Apache 2.0许可下的开源权重分发提供，权重可在Hugging Face和GitHub等平台上获得。开发者可以通过阿里巴巴云的Bailian平台以OpenAI格式兼容的API集成它。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送

加载中...

Qwen3.5-397B-A17B

发布时间: 2026-02-16更新于: 2026-02-16 19:02:35.478103

在线体验 GitHub Hugging Face Compare

模型参数

397.0亿

上下文长度

256K

中文支持

支持

推理能力

数据优先来自官方发布（GitHub、Hugging Face、论文），其次为评测基准官方结果，最后为第三方评测机构数据。了解数据收集方法

Qwen3.5-397B-A17B

模型基本信息

推理过程

支持

上下文长度

256K tokens

最大输出长度

暂无数据

模型类型

多模态大模型

发布时间

2026-02-16

模型文件大小

暂无数据

MoE架构

是

总参数 / 激活参数

397.0 亿 / 17 亿

知识截止

暂无数据

推理模式

常规模式（Non-Thinking Mode）思考模式（Thinking Mode）深度思考（Deeper Thinking Mode）

Qwen3.5-397B-A17B

开源和体验地址

代码开源状态

Apache 2.0

预训练权重开源

Apache 2.0- 免费商用授权

GitHub 源码

https://github.com/QwenLM/Qwen3.5

Hugging Face

https://huggingface.co/Qwen/Qwen3.5-397B-A17B

在线体验

https://chat.qwen.ai

Qwen3.5-397B-A17B

官方介绍与博客

官方论文

Qwen3.5: Towards Native Multimodal Agents

DataLearnerAI博客

暂无介绍博客

Qwen3.5-397B-A17B

API接口信息

接口速度

3/5

💡默认单位：$/100万 tokens。若计费单位不同，则以供应商公开的原始标注为准。

标准计费Standard

模态	输入	输出
文本	0.6	3.6

Qwen3.5-397B-A17B

评测得分

综合评估

共 5 项评测

评测名称 / 模式

得分

排名/总数

C-Eval思考

2 / 3

GPQA Diamond思考

88.40

10 / 150

MMLU Pro思考

87.80

7 / 112

HLE思考 + 使用工具

48.30

9 / 99

HLE思考

28.70

35 / 99

编程与软件工程

共 2 项评测

评测名称 / 模式

得分

排名/总数

LiveCodeBench思考 + 使用工具

83.60

10 / 103

SWE-bench Verified思考

76.40

13 / 85

Agent能力评测

共 1 项评测

评测名称 / 模式

得分

排名/总数

τ²-Bench思考 + 使用工具

86.70

5 / 35

指令跟随

共 1 项评测

评测名称 / 模式

得分

排名/总数

IF Bench思考 + 使用工具

76.50

1 / 23

AI Agent - 信息收集

共 1 项评测

评测名称 / 模式

得分

排名/总数

BrowseComp思考 + 使用工具

9 / 25

AI Agent - 工具使用

共 1 项评测

评测名称 / 模式

得分

排名/总数

Terminal Bench 2.0思考 + 使用工具

52.50

7 / 18

数学推理

共 2 项评测

评测名称 / 模式

得分

排名/总数

AIME 2026思考

91.30

6 / 7

IMO-AnswerBench思考

80.90

6 / 6

长上下文能力

共 1 项评测

评测名称 / 模式

得分

排名/总数

AA-LCR思考

68.70

3 / 6

查看评测深度分析与其他模型对比

Qwen3.5-397B-A17B

发布机构

阿里巴巴

查看发布机构详情

Qwen3.5-397B-A17B

模型解读

DataLearner 官方微信

欢迎关注 DataLearner 官方微信，获得最新 AI 技术推送