DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
Page navigation
目录
Model catalogQwen3-VL-2B-Thinking
QW

Qwen3-VL-2B-Thinking

Qwen3-VL-2B-Thinking

Release date: 2025-10-22更新于: 2025-10-22 08:34:26320
Live demoGitHubHugging FaceCompare
Parameters
20.0亿
Context length
256K
Chinese support
Supported
Reasoning ability

Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology

Qwen3-VL-2B-Thinking

Model basics

Reasoning traces
Supported
Context length
256K tokens
Max output length
32768 tokens
Model type
多模态大模型
Release date
2025-10-22
Model file size
No data
MoE architecture
No
Total params / Active params
20.0B / N/A
Knowledge cutoff
No data
Inference modes
思考模式(Thinking Mode)
Qwen3-VL-2B-Thinking

Open source & experience

Code license
Apache 2.0
Weights license
Apache 2.0- 免费商用授权
GitHub repo
https://github.com/QwenLM/Qwen3-VL
Hugging Face
https://huggingface.co/Qwen/Qwen3-VL-2B-Thinking
Live demo
No live demo
Qwen3-VL-2B-Thinking

Official resources

Paper
Qwen3 Technical Report
DataLearnerAI blog
阿里再发开源版本Qwen3-VL模型,2个稠密架构的多模态理解大模型,分别是手机可运行的Qwen3-VL-2B和Qwen3-VL-32B:评测结果超GPT-5 Mini
Qwen3-VL-2B-Thinking

API details

API speed
3/5
No public API pricing yet.
Qwen3-VL-2B-Thinking

Benchmark Results

No benchmark data to show.
Qwen3-VL-2B-Thinking

Publisher

阿里巴巴
阿里巴巴
View publisher details
Qwen3-VL-2B-Thinking

Model Overview

模型简介与定位

Qwen3-VL-2B-Thinking 是 Qwen3-VL 系列的轻量级推理增强版本,由阿里巴巴 Qwen 团队发布。该模型在 2B 参数体量下,通过强化链式思维(Chain-of-Thought, CoT)与视觉-文本推理能力,实现多模态输入下的逻辑、时序与空间理解。

架构与技术规格

模型采用稠密结构(Dense),参数规模约 20 亿,具备原生 256K 上下文,可扩展至 1M。引入 Interleaved-MRoPE(多维旋转位置编码)与 DeepStack 层级融合结构,用于对齐多帧视频与长文本的时间序列。其 Thinking 版本在训练阶段额外使用强化推理标注数据集,优化视觉与语言间的因果与条件关系推断。

核心能力与模态支持

支持图像、视频、文本输入及文本输出,擅长长时视频推理、视觉链式推理、多轮多模态问答、STEM 场景因果判断等任务。通过多步思维路径生成,显著提升了在复杂视觉-逻辑任务下的稳定性。

性能与评测

根据官方模型卡,Thinking 版本在视觉 QA、时序推理与文档跨页理解等基准中较 Instruct 模型有更高的准确率。官方未公开具体数值,本条仅摘录结构性信息。

访问与许可

模型已在 Hugging Face 发布,许可为 Apache-2.0;源代码位于 Qwen3-VL 官方仓库,可通过 Transformers 推理接口直接加载使用。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码