计算机视觉的五个趋势
这是一篇来自Sayak Paul的预测,这个哥们长期混迹于各个开源社区,积极参与各大公司的开发者大会。目前在一家初创企业工作,简历非常丰富,非常积极在社区推广自己。但是不管怎么说,他在计算机视觉领域也是一直在一线工作。他对未来计算机视觉的发展方向有五个预测,虽然不一定准确,但是我们可以借助这个进行思考。

趋势一:资源节约型的模型(Resource-Efficient Models)
如今,最先进的计算机视觉的模型越来越多,难以在边缘设备如手机等运行。这些大模型虽然效果很好,但是成本巨大,且时延很高。在没有云基础设施的支撑下很难被使用。因此,需要一些低资源消耗的模型进行生产部署。主要方向包括:
稀疏训练:通过丢弃某个低于阈值的网络参数或者是放弃某些维度的互相作用,以加快网络的训练。虽然可能会丢失一些精度,但是可以降低成本,减少训练时间。
训练后的推理:在模型训练后,降低参数精度,通过量化感知训练,补偿降低精度造成的信息损失。
知识蒸馏:训练一个高性能的教师模型,然后通过训练另一个较小的学生模型来提炼其 "知识",以匹配教师所产生的标签。


