重磅!阿里开源2个多模态向量大模型和重排序大模型:Qwen3-VL-Embedding和Qwen3-VL-Reranker,图片和视频也可以用来做RAG了!
RAG(Retrieval-Augmented Generation,检索增强生成) 一直被认为是大模型突破上下文长度限制、融合外部最新知识的最佳实践路径之一。然而,现有 RAG 方案在绝大多数场景下仍然以文本检索为核心,对于图片、视频等多模态数据,业界长期缺乏成熟、可用,尤其是开源的通用模型支撑。
就在刚刚,阿里巴巴正式了两款全新的多模态模型——(多模态向量模型)和 (多模态重排序模型),首次在开源体系中系统性补齐了多模态 RAG 在“向量化检索 + 精排重排”两个关键环节上的能力空白。这两个模型是基于强大的Qwen3-VL基础模型构建的专用多模态向量与重排(Reranking)模型。该系列模型能够无缝处理文本、图像、视频等多种模态输入,在多项多模态检索任务的Benchmark上,其中8B尺寸的向量模型在MMEB-V2排行榜上以。Qwen3-VL-Reranker模型在多个评测基准上同样大幅超越了现有的主流开源竞品。


