Qwen3-VL-8B-Thinking
Qwen3-VL-8B-Thinking
模型参数
87.7亿
上下文长度
256K
中文支持
不支持
推理能力
模型基本信息
推理过程
支持
上下文长度
256K tokens
最大输出长度
暂无数据
模型类型
暂无数据
发布时间
2025-10-15
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
87.7 亿 / 不涉及
知识截止
暂无数据
推理模式
常规模式(Non-Thinking Mode)思考模式(Thinking Mode)
开源和体验地址
官方介绍与博客
DataLearnerAI博客
暂无介绍博客
API接口信息
接口速度
3/5
暂无公开的 API 定价信息。
评测得分
当前尚无可展示的评测数据。
发布机构
阿里巴巴
查看发布机构详情 模型解读
模型简介与发布
Qwen3-VL-8B-Thinking 为 Qwen3-VL 系列的中型推理增强多模态模型,于 2025-10-15 与 4B/8B Instruct/Thinking 同步发布。
架构与规格
- 参数规模:约 8.77B。
- 上下文:原生 256K,可扩展至 1M。
- 架构更新:Interleaved-MRoPE、DeepStack、多模态文本-时间戳对齐。
- 许可:Apache-2.0。
核心能力与模态
支持图像/视频输入与文本输出,覆盖 OCR(32 语种)、版面解析、复杂空间推理与长视频时序定位,以及“视觉代理”场景(GUI 元素识别、功能理解与步骤执行)。
访问方式
- GitHub:Qwen3-VL 代码与示例。
- Hugging Face:提供本模型权重与模型卡。
DataLearner 官方微信
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
