更小更快更精准的对象检测模型——SuperYOLO发布

原文摘要：准确检测多尺度小目标并使用遥感图像（RSI）实现实时检测仍然具有挑战性，特别是对于军事侦察和紧急救援等时间敏感任务。为了获得这些小目标的精确位置和分类，最适用的解决方案之一是融合多模态图像中的互补信息，以提高检测能力。现有的大多数解决方案主要设计一个复杂的深度神经网络来学习与背景分离的对象的强大特征表示，这通常会导致沉重的计算负担。在本文中，我们提出了一种精确而快速的RSI小目标检测方法SuperYOLO，该方法融合多模式数据，通过利用辅助超分辨率（SR）学习并考虑检测精度和计算成本，对多尺度对象执行高分辨率（HR）目标检测。首先，我们通过删除Focus模块来构建一个紧凑的基线，以保留HR特征并显著克服小对象的丢失错误。其次，我们利用像素级多模式融合（MF）从各种数据中提取信息，以便为RSI中的小对象提供更合适和有效的特征。此外，我们设计了一个简单而灵活的SR分支来学习HR特征表示，该特征表示可以用低分辨率（LR）输入区分广阔背景中的小目标，从而进一步提高检测精度。此外，为了避免引入额外的计算，在推理阶段丢弃了SR分支，并且由于LR输入减少了网络模型的计算。实验结果表明，在广泛使用的VEDAI RS数据集上，SuperYOLO的准确率为73.61%（以mAP50计），比SOTA大型模型（如YOLOv5l、YOLOv 5x和RS设计的YOLOR）高出10%以上。同时，SuperYOLO的GFOLP和参数大小约为YOLOv5x的18.1倍和4.2倍。与最先进的模型相比，我们提出的模型显示出良好的精度-速度权衡。

对象检测一直是计算机视觉领域最重要的问题之一，在自动驾驶、安防等领域都有重要的应用价值。而YOLO系列一直是CV领域对象检测算法演进的重要方法，在前段时间YOLO V7发布后（[YOLO V7来临！刚刚台湾省中央研究院资讯科学研究所研究人员发布最新版本YOLO](https://www.datalearner.com/ai-resources/ai-paper-news/1051657164514399 "YOLO V7来临！刚刚台湾省中央研究院资讯科学研究所研究人员发布最新版本YOLO")），这个版本系列已经有七八年时间了。而最近，西电（西安电子科技大学，不知道为啥英文是xidian university）的研究人员提出了SuperYOLO，模型缩小的同时，准确性提升。

下图是实际结果的对比：
<center>![](https://www.datalearner.com/resources/blog_images/bcb0e1ec-7d57-45e4-a137-c92349708e9e.png)</center>
<center></center>
结果还是相当不错的。

根据论文的描述，作者的方法主要是设计了一些灵活的方法来删除Focus，学习high resolution特征。下图展示了SuperYOLO在网络结构上的创新点：

<center>![](https://www.datalearner.com/resources/blog_images/9a90385f-b3c9-4d09-9ce4-75b9b482b697.png)</center>
<center></center>

下图展示了SuperYOLO与之前算法的一些对比：
<center>![](https://www.datalearner.com/resources/blog_images/6e26d539-c3e8-4e4a-bb30-8a8863259c4b.png)</center>

可以看到，模型参数方面，SuperYOLO比之前的模型小不少，但是效果方面十分优秀。本文目前投稿至[IEEE Transactions on Neural Networks and learning systems](https://www.datalearner.com/academic/journal/detail/2162-237X "IEEE Transactions on Neural Networks and learning systems")，等待结果中。

目前作者的代码已经准备好开源：https://github.com/icey-zhang/SuperYOLO

不过，作者因为论文还没有接受，所以并没有完全公开。
<center>![](https://www.datalearner.com/resources/blog_images/173359e0-8a69-4eb1-9036-1360fdd0a47b.png)</center>
<center></center>

话说，学术界为了追求速度，已经是卷到这个地步了。。。。

更小更快更精准的对象检测模型——SuperYOLO发布

论文名：SuperYOLO: Super Resolution Assisted Object Detection in Multimodal Remote Sensing Imagery

发布时间：2022年9月

论文地址：https://arxiv.org/abs/2209.13351

代码地址：https://github.com/icey-zhang/SuperYOLO