阿里开源2个全新多模态理解大模型Qwen3-VL-4B和8B:主流评测结果超Gemini 2.5 Flash Lite、GPT-5 Nano,面向多模态Agent和机器人应用打造
就在刚才,阿里云Qwen团队推出了两个多模态理解大模型Qwen3-VL-4B和Qwen3-VL-8B,本次发布的模型是较小参数规模的模型,可以用于消费级硬件(手机/PC)等,且都是稠密架构。

本次开源的模型的核心亮点在于其全能力保留的同时大幅降低资源需求。Qwen3-VL-4B和8B各有Instruct(标准指令)和Thinking(推理优化)两种变体,专为高保真视觉理解和复杂推理设计。

