DeepSeek Vision-Language-7B-Base
DeepSeek Vision-Language-7B-Base is an AI model published by DeepSeek-AI, released on 2024-03-11, for 多模态大模型, with 70.0B parameters, and 4K tokens context length, requiring about 14GB storage, under the DEEPSEEK LICENSE AGREEMENT license.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
DeepSeek Vision-Language-7B-Base简称DeepSeek VL-7B-Base,是DeepSeekAI开源的一个多模态大模型,可以理解图片。最高支持1024*1024分辨率图像的输入,是目前已知的支持最高图像解析度的多模态大模型之一。
DeepSeek VL-7B-Base是基于DeepSeek-LLM-7B-Base版本进行训练的,是基础语言模型上增加图片理解能力,语言模型部分是基于2万亿tokens数据集预训练得到。而整个Deepseek Vision-Language-7B-Base则是再4000亿图像-语言tokens数据集上训练的。除了此处说的Base版本外,DeepSeek-VL模型还包括指令优化的版本: https://www.datalearner.com/ai-models/pretrained-models/deepseek-vl-7b-chat
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
