Yi Visual Language - 6B
Yi Visual Language - 6B 是由 零一万物 发布的 AI 模型,发布时间为 2024-01-22,定位为 多模态大模型,参数规模约为 60.0B,上下文长度为 2K,模型文件大小约 12.35GB,采用 Yi Series Models License Agreement 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
Yi-VL-6B全称是Yi Visual Language - 6B的简称,是一个多模态大模型,该模型是基于LLaVA架构完成的。该模型可以接受文本和图片的输入,但是可以返回文本结果。
Yi-VL-6B支持中英文两种语言,可以做图片的理解和文本的识别。根据官方的描述,这个模型可以用来抽取、组织并总结图片中的信息。最高支持448×448像素的图片输入。
该模型实测:

除了60亿参数模型外,还有340亿参数的Yi-VL-34B,这个模型取得了目前多模态评测榜单第一。

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
