QW

Qwen3-VL-32B-Thinking

Qwen3-VL-32B-Thinking

发布时间: 2025-10-22296
模型参数
320.0亿
上下文长度
256K
中文支持
支持
推理能力

模型基本信息

推理过程
支持
上下文长度
256K tokens
最大输出长度
32768 tokens
模型类型
多模态大模型
发布时间
2025-10-22
模型文件大小
暂无数据
MoE架构
总参数 / 激活参数
320.0 亿 / 不涉及
知识截止
暂无数据
推理模式
思考模式(Thinking Mode)

开源和体验地址

代码开源状态
预训练权重开源
Apache 2.0- 免费商用授权
在线体验
暂无在线体验地址

官方介绍与博客

API接口信息

接口速度
2/5
暂无公开的 API 定价信息。

评测得分

当前尚无可展示的评测数据。

发布机构

模型解读

模型简介与定位

Qwen3-VL-32B-Thinking 是 Qwen3-VL 系列的高性能推理型多模态模型,由阿里巴巴 Qwen 团队发布。该版本针对复杂视觉推理、多步思维链条和长文档跨页理解进行了优化,具备更强的跨模态逻辑一致性与解释能力。

架构与技术规格

模型为稠密结构(Dense),总参数约 320 亿,原生上下文 256K,可扩展至 1M。使用 Interleaved-MRoPE 与 DeepStack 技术增强视觉-语言对齐,并在训练中引入多步视觉推理与复杂时序任务以增强思考模式性能。

核心能力与模态支持

支持图像、视频、文本输入,输出为文本。可进行多步视觉推理、复杂因果分析、跨模态引用追踪、科学计算场景中的视觉解释与时间序列预测等任务。

性能与评测

根据官方模型卡,Thinking 版本在视觉推理和多模态 QA 任务上表现优于同系列 Instruct 模型,在长视频与文档 OCR 推理中具备更稳定的逐步输出结构。

访问与许可

模型权重托管于 Hugging Face,许可为 Apache-2.0;代码与示例位于官方 Qwen3-VL 仓库,可通过 Transformers 或 Qwen SDK 直接推理使用。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码