DeepSeek Vision-Language-1.3B-Chat
DeepSeek Vision-Language-1.3B-Chat is an AI model published by DeepSeek-AI, released on 2024-03-11, for 多模态大模型, with 13.0B parameters, and 4K tokens context length, requiring about 2.6GB storage, under the DEEPSEEK LICENSE AGREEMENT license.
Data sourced primarily from official releases (GitHub, Hugging Face, papers), then benchmark leaderboards, then third-party evaluators. Learn about our data methodology
Deepseek Vision-Language-1.3B-Chat简称Deepseek VL-1.3B-Chat,是DeepSeekAI开源的一个多模态大模型,可以理解图片。是一个可以在移动端运行的图片理解的多模态大模型。最高支持384*384分辨率图像的输入,是目前已知的支持最高图像解析度的多模态大模型之一。
Deepseek VL-1.3B-Chat是基于DeepSeek-LLM-1.3B-Chat版本进行训练的,语言模型部分是在5000亿tokens数据集上训练得到,而整个Deepseek VL-1.3B-Base模型则是在4000亿图像-语言tokens数据集上训练得到的。这个版本是指令优化的语言模型基础上拓展而来,支持聊天场景,基础版本的模型参考: https://www.datalearner.com/ai-models/pretrained-models/deepseek-vl-1_3b-base
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
