DataLearner 标志DataLearnerAI
最新AI资讯
大模型排行榜
大模型评测基准
大模型列表
大模型对比
资源中心
工具
语言中文
DataLearner 标志DataLearner AI

专注大模型评测、数据资源与实践教学的知识平台,持续更新可落地的 AI 能力图谱。

产品

  • 评测榜单
  • 模型对比
  • 数据资源

资源

  • 部署教程
  • 原创内容
  • 工具导航

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner 持续整合行业数据与案例,为科研、企业与开发者提供可靠的大模型情报与实践指南。

隐私政策服务条款
页面导航
页面导航
大模型列表InstructBLIP
IN

InstructBLIP

基础大模型

InstructBLIP

发布时间: 2023-05-11更新于: 2023-05-13 19:56:24.660333
在线体验GitHubHugging FaceCompare
模型参数
130亿
上下文长度
2K
中文支持
不支持
推理能力

InstructBLIP 是由 Salesforce 发布的 AI 模型,发布时间为 2023-05-11,定位为 基础大模型,参数规模约为 130.0B,上下文长度为 2K。

数据优先来自官方发布(GitHub、Hugging Face、论文),其次为评测基准官方结果,最后为第三方评测机构数据。 了解数据收集方法

InstructBLIP

模型基本信息

推理过程
不支持
思考模式
不支持思考模式
上下文长度
2K tokens
最大输出长度
暂无数据
模型类型
基础大模型
发布时间
2023-05-11
模型文件大小
暂无数据
MoE架构
否
总参数 / 激活参数
130 亿 / 不涉及
知识截止
暂无数据
InstructBLIP

开源和体验地址

代码开源状态
暂无数据
预训练权重开源
暂无数据
GitHub 源码
https://github.com/salesforce/LAVIS/tree/main/projects/instructblip
Hugging Face
暂无开源HuggingFace地址
在线体验
暂无在线体验地址
InstructBLIP

官方介绍与博客

官方论文
InstructBLIP: Towards General-purpose Vision-Language Models with Instruction Tuning
DataLearnerAI博客
暂无介绍博客
InstructBLIP

API接口信息

接口速度
暂无数据
暂无公开的 API 定价信息。
InstructBLIP

评测结果

当前尚无可展示的评测数据。

和其他模型对比

暂时没有为该模型整理的相关对比页面。

想自定义其他组合?打开对比工具

InstructBLIP

发布机构

Salesforce
Salesforce
查看发布机构详情
InstructBLIP

模型解读

InstructBLIP是由Saleforce发布的一个视觉领域的预训练大模型。它是针对预训练的BLIP-2模型进行了一项系统和全面的视觉-语言指令调整研究。


构建通用的视觉-语言模型是具有挑战性的,因为视觉输入会增加任务差异。尽管视觉-语言预训练已经得到广泛研究,但视觉-语言指令调整相对较少被探索。


Saleforce收集了26个公开数据集,将其转换为Instruction-Finetuned格式,并将其分类为两个cluster以进行指令调整和零-shot评估。此外,InstructBLIP引入了指令感知的视觉特征提取,这是一种关键的方法,使模型能够提取与给定指令相适应的信息特征。最终的InstructBLIP模型在所有13个零-shot数据集上实现了最新的表现,显着优于BLIP-2和更大的Flamingo。InstructBLIP模型在单独的下游任务(例如,ScienceQA IMG的90.7%的准确性)上也达到了最新的表现水平。


InstructBLIP支持Instruction-following Image-to-Text,即基于指令的图像生成文本。

DataLearner 官方微信

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码