MS COCO - Common Objects in Contenxt

COCO全称是Common Objects in Contenxt,由微软研究院和几位高校老师合作发布的图像数据集。最早的版本是2015年发布,2107年发布了新的版本。

各个版本的记录数如下:

年份(年)数据集类型记录数(万张)大小(GB)
2014训练集8.313
2014验证集4.16
2014测试集4.16
2015测试集8.112
2017训练集11.818
2017验证集0.51
2017测试集4.16
2017未标注数据12.319

COCO数据集十分著名,也和历年的学术会议挑战赛有关。不同年份的数据集也被用来测试不同任务。这些数据支持的任务包括图像检测(Detection)、图像描述(Captioning)、关键点(keypoint)、具有特定尺寸和形状的物体(COCO Stuff )、全景分割(Panoptic Segmentation)等。

这份数据的标注也很详细。具体来说:

  • 150万个对象实例
  • 80个对象类别
  • 91个特定尺寸和形状的类别
  • 每个图片包含5个描述
  • 25万个带关键点的人物

需要注意的是:

  1. 部分图片没有标注;
  2. COCO 2014和2017数据集使用相同的图像集,但训练集、验证集和测试集的划分不同;
  3. 测试拆分没有任何标注,只有图像;
  4. 数据集总共定义了91个类,但只使用了80个类;
  5. 全景注释定义了200个类,但只使用133个。

官方下载地址: https://cocodataset.org/#download 

GitHub地址: https://github.com/cocodataset/cocodataset.github.io 

PapersWithCode地址: https://deepai.org/dataset/coco 

发布者:Microsoft

发布时间:2014年

官方网址:https://cocodataset.org/

数据记录总数:167000

数据集大小:25GB

MS COCO - Common Objects in Contenxt
MS COCO - Common Objects in Contenxt所属的领域
计算机视觉

计算机视觉

Computer Vision

35个资源

自然语言处理

自然语言处理

Natural Language Process

35个资源

MS COCO - Common Objects in Contenxt相关的任务
图像分割

图像分割

Image Segmentation

35个资源

对象检测

对象检测

Object Detection

35个资源

图片说明

图片说明

Image Captioning

35个资源