QW

Qwen3.5-397B-A17B

多模态大模型Qwen3.5

Qwen3.5-397B-A17B

发布时间: 2026-02-16更新于: 2026-04-08 08:57:55.2052,542
模型参数
397亿
上下文长度
256K
中文支持
支持
推理能力

Qwen3.5-397B-A17B 是由 阿里巴巴 发布的 AI 模型,发布时间为 2026-02-16,定位为 多模态大模型,参数规模约为 397亿,上下文长度为 256K,采用 Apache 2.0 许可,在 C-Eval 上取得 93.00 分。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

Qwen3.5-397B-A17B

模型基本信息

推理过程
支持
思考模式
思考模式 (默认)常规模式
上下文长度
256K tokens
最大输出长度
暂无数据
模型类型
多模态大模型
输入/输出模态
文本、图像、视频 → 文本
发布时间
2026-02-16
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
397亿 / 17亿
知识截止
暂无数据
Qwen3.5-397B-A17B

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0- 免费商用授权
Qwen3.5-397B-A17B

官方介绍与博客

DataLearnerAI博客
暂无介绍博客
Qwen3.5-397B-A17B

API接口信息

接口速度
3/5
💡默认单位:$/100万 tokens。若计费单位不同,则以供应商公开的原始标注为准。
标准模式
类型适用条件输入输出
文本-$0.500/ 1M$3.00/ 1M
缓存定价Prompt缓存
类型有效期写入读取
文本5m$0.625/ 1M$0.050/ 1M
Qwen3.5-397B-A17B

评测结果

Qwen3.5-397B-A17B 当前已收录的代表性评测结果包括 MMLU Pro(10 / 126,得分 87.80)、Pinch Bench(3 / 37,得分 89.10)、IF Bench(3 / 29,得分 76.50)。 本页还汇总了参数规模、上下文长度与 API 价格,便于结合评测结果与部署约束一起判断模型适配度。

思考模式
工具使用
联网能力

综合评估

共 5 项评测
评测名称 / 模式
得分
排名/总数
C-Eval
思考模式
93
3 / 9
GPQA Diamond
思考模式
88.40
27 / 179
MMLU Pro
思考模式
87.80
10 / 126
HLE
思考模式
28.70
84 / 161
HLE
思考模式工具联网
48.30
30 / 161

编程与软件工程

共 4 项评测
评测名称 / 模式
得分
排名/总数
LiveCodeBench
思考模式
83.60
20 / 120
SWE-bench Verified
思考模式工具
76.40
29 / 108
69.30
17 / 20
50.90
30 / 44

多模态理解

共 1 项评测
评测名称 / 模式
得分
排名/总数
MMMU
思考模式
85
4 / 28

Agent能力评测

共 1 项评测
评测名称 / 模式
得分
排名/总数
τ²-Bench
思考模式工具
86.70
7 / 40

指令跟随

共 1 项评测
评测名称 / 模式
得分
排名/总数
IF Bench
思考模式
76.50
3 / 29

AI Agent - 信息收集

共 2 项评测
评测名称 / 模式
得分
排名/总数
BrowseComp
思考模式工具联网
78.60
16 / 46
BrowseComp
思考模式工具
69
23 / 46

AI Agent - 工具使用

共 3 项评测
评测名称 / 模式
得分
排名/总数
OSWorld-Verified
思考模式工具
62.20
14 / 19
Terminal Bench 2.0
思考模式工具
52.50
29 / 46
Tool Decathlon
思考模式工具
38.30
5 / 7

数学推理

共 2 项评测
评测名称 / 模式
得分
排名/总数
AIME 2026
思考模式
91.30
12 / 15
IMO-AnswerBench
思考模式
80.90
16 / 20

长上下文能力

共 2 项评测
评测名称 / 模式
得分
排名/总数
AA-LCR
思考模式
68.70
5 / 13
LongBench v2
常规模式
63.20
2 / 11

OpenClaw智能体能力综合测评

共 1 项评测
评测名称 / 模式
得分
排名/总数
Pinch Bench
思考模式工具
89.10
3 / 37

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

Qwen3.5-397B-A17B

发布机构

Qwen3.5-397B-A17B

模型解读

Qwen3.5-Plus模型就是阿里官方托管提供的Qwen3.5-397B-A17B模型。


Qwen3.5-397B-A17B模型由阿里巴巴云的Qwen团队开发,于2026年2月16日发布,作为Qwen3.5系列的首个开源权重模型。该模型作为原生视觉-语言基础模型,针对多模态代理应用的进步。

在架构和技术规格方面,它采用混合设计,将通过Gated Delta Networks的线性注意力与稀疏专家混合(MoE)结构集成,导致总参数量为3970亿,每次前向传递激活参数为170亿。上下文窗口扩展至256,000个token,便于处理推理和多模态任务中的扩展序列。预训练涉及大规模视觉-文本token,数据在中文和英文、多语言内容、STEM领域和推理元素方面丰富,并经过严格过滤。

关于核心能力和模态,该模型原生支持文本、图像和视频输入,同时生成文本输出。它在多模态推理方面表现出色,包括视觉理解、空间智能、视频分析、语言理解、代码生成以及代理工作流与工具集成,如网络搜索和代码解释器。

在性能指标上,该模型在MMLU-Pro上获得87.8分,MMLU-Redux上94.9分,SuperGPQA上70.4分,MMMU上85.0分,MMMU-Pro上79.0分,MathVision上88.6分,RealWorldQA上83.9分,VideoMME上87.5分,以及MVBench上77.6分。在比较中,它在知识、推理和编码基准上优于GLM-4.5-355B-A32B和DeepSeek-V3.2-671B-A37B等模型,同时相对于Qwen3-Max在32k和256k上下文中提供8.6x至19.0x更高的解码吞吐量,相对于Qwen3-235B-A22B提供3.5x至7.2x。

对于应用场景,它适用于自治代理系统、视觉推理、编码协助和GUI自动化。已知限制包括在超长视频处理或训练数据未覆盖的高度专业化领域中的潜在约束。

访问通过Apache 2.0许可下的开源权重分发提供,权重可在Hugging Face和GitHub等平台上获得。开发者可以通过阿里巴巴云的Bailian平台以OpenAI格式兼容的API集成它。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码