MiniGPT-4
MiniGPT-4 是由 King Abdullah University of Science and Technology 发布的 AI 模型,发布时间为 2023-04-16,定位为 多模态大模型,参数规模约为 130.0B,上下文长度为 2K,采用 开源不可商用 许可。
数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法
MiniGPT-4是一个可以理解图片的大语言模型,是由开源的预训练模型Vicuna-13B与BLIP-2结合的新模型。
MiniGPT-4是分两个阶段训练的。
研究发现,MiniGPT-4具有许多与GPT-4类似的功能,比如生成详细的图像描述和从手写草稿创建网站。MiniGPT-4还有其他新兴功能,包括根据给定的图像撰写故事和诗歌,提供解决图像中显示的问题的方法,以及基于食品照片教用户如何烹饪等。下图是一个实例:

MiniGPT-4的数据集、论文等完全公开。
MiniGPT-4开源代码地址: https://github.com/Vision-CAIR/MiniGPT-4
MiniGPT-4第一阶段数据集地址: https://github.com/Vision-CAIR/MiniGPT-4/blob/main/dataset/README_1_STAGE.md
MiniGPT-4第二阶段数据集地址: https://github.com/Vision-CAIR/MiniGPT-4/blob/main/dataset/README_2_STAGE.md
MiniGPT-4官网地址: https://minigpt-4.github.io/
MiniGPT-4在线演示地址: https://minigpt-4.github.io/
MiniGPT-4论文地址: https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf
欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送
