DeepSeek Vision-Language-7B-Base
DeepSeek Vision-Language-7B-Base 是由 DeepSeek-AI 发布的 AI 模型,发布时间为 2024-03-11,定位为 多模态大模型,参数规模约为 70.0B,上下文长度为 4K,模型文件大小约 14GB,采用 DEEPSEEK LICENSE AGREEMENT 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
DeepSeek Vision-Language-7B-Base简称DeepSeek VL-7B-Base,是DeepSeekAI开源的一个多模态大模型,可以理解图片。最高支持1024*1024分辨率图像的输入,是目前已知的支持最高图像解析度的多模态大模型之一。
DeepSeek VL-7B-Base是基于DeepSeek-LLM-7B-Base版本进行训练的,是基础语言模型上增加图片理解能力,语言模型部分是基于2万亿tokens数据集预训练得到。而整个Deepseek Vision-Language-7B-Base则是再4000亿图像-语言tokens数据集上训练的。除了此处说的Base版本外,DeepSeek-VL模型还包括指令优化的版本: https://www.datalearner.com/ai-models/pretrained-models/deepseek-vl-7b-chat
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
