陈韫韬:中国科学院自动化研究所在读博士,主要研究方向目标检测。

报告题目:尺度特化的三叉戟目标检测网络
报告摘要:二维图像识别任务中目标尺度的变化一直是一个重要的研究问题。在本中文,我们首先设计了一组受控实验下研究网络感受野与检测器在不同尺度的检测目标上的性能的关系。基于这一基本实验发现,我们提出了一种全新的针对不同尺度物体具有统一表示能力的三叉戟网络。我们利用权重共享的平行网络分支来实现具有不同感受野的特征图。我们针对具有不同感受野的分支采取了尺度特化的训练方式。在三叉戟网络的基础上,我们提出了一种快速三叉戟网络,相比基线检测器,能在不增加计算量的情况下大幅提升检测器的性能。结合 ResNet-101 基础网络,我们的方法在 COCO 测试开发集能取得 48.4 mAP 的性能。我们同时提供基于 Detetron2(PyTorch) 和 SimpleDet(MXNet) 的开源代码。
Spotlight:
分析了网络感受野与检测器在不同尺度的检测目标上的性能的关系。
提出了一种全新的针对不同尺度物体具有统一表示能力的三叉戟网络以及其快速变种。
1. A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection

推荐理由:这是一篇针对多尺度模型设计进行详尽分析的工作,文章从图像输入,网络降采样层级以及匹配模版等三个方面详尽分析了多尺度模型的设计要素。
2. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks

推荐理由:这是一篇分析如何在图像输入分辨率,网络宽度,网络深度之间分配计算量的工作,其中的思想在处理多尺度问题时值得借鉴。
录播视频 / 推荐论文下载 / 讲者PPT 登录后获取查看地址