标签

「Qwen3-VL」相关文章

汇总「Qwen3-VL」相关的原创 AI 技术文章与大模型实践笔记，持续更新。

标签:#Qwen3-VL

重磅！阿里开源2个多模态向量大模型和重排序大模型：Qwen3-VL-Embedding和Qwen3-VL-Reranker，图片和视频也可以用来做RAG了！

就在刚刚，阿里巴巴正式免费开源了两款全新的多模态模型——Qwen3-VL-Embedding（多模态向量模型）和 Qwen3-VL-Reranker（多模态重排序模型），首次在开源体系中系统性补齐了多模态 RAG 在“向量化检索 + 精排重排”两个关键环节上的能力空白。这两个模型是基于强大的Qwen3-VL基础模型构建的专用多模态向量与重排（Reranking）模型。

2026/01/08 23:07:091,656

#Qwen3-VL-Embedding #Qwen3-VL-Reranker

评测结果超GPT-5 mini和Claude 4 Sonnet，阿里再发开源版本Qwen3-VL模型：手机可运行的Qwen3-VL-2B和Qwen3-VL-32B

就在今日，阿里巴巴Qwen团队重磅推出Qwen3-VL-2B和Qwen3-VL-32B两款视觉语言模型，这些dense架构的创新之作，将多模态AI的强大能力压缩进更紧凑的框架中，显著降低了部署门槛。作为Qwen3系列的最新扩展，它们在保持顶级性能的同时，支持从边缘设备到云端的无缝应用——想象一下，一款手机App就能实时分析2小时视频，或从模糊手写笔记中提取精确信息。这不仅仅是参数缩减，更是AI普惠化的关键一步，帮助开发者以更低的成本实现视觉智能的突破。

2025/10/22 21:55:521,035

#Qwen3-VL-2B #Qwen3-VL-32B

阿里开源2个全新多模态理解大模型Qwen3-VL-4B和8B：主流评测结果超Gemini 2.5 Flash Lite、GPT-5 Nano，面向多模态Agent和机器人应用打造

就在刚才，阿里云Qwen团队推出了两个多模态理解大模型Qwen3-VL-4B和Qwen3-VL-8B，本次发布的模型是较小参数规模的模型，可以用于消费级硬件（手机/PC）等，且都是稠密架构。

2025/10/15 09:06:341,693

#Qwen3-VL #图像识别

阿里正式开源最强视觉理解大模型Qwen3-VL：关键评测基准超Gemini 2.5 Pro，支持针对视觉输入进行推理，甚至可以理解3D场景

今日，QwenTeam 正式发布了全新一代多模态视觉语言模型 —— Qwen3-VL 系列。这是 Qwen 家族迄今为止最强大的视觉语言模型，在视觉感知、跨模态推理、长上下文理解、空间推理和智能代理交互等多个维度全面提升。旗舰开源模型 Qwen3-VL-235B-A22B 已经上线，并提供 Instruct 和 Thinking 两个版本，前者在视觉感知上全面对标并超过 Gemini 2.5 Pro，后者则在多模态推理基准上创下新纪录，成为开源阵营的最强视觉理解大模型。

2025/09/24 08:14:191,179

#Qwen3-VL