付君:中国科学院自动化研究所在读博士,主要的研究方向图像语义分割。
报告题目:Adaptive Context Network for Scene Parsing
报告摘要:场景解析中需要预测出场景图像中的像素点属于某一目标类或场景类。上下文的利用对于识别每个像素点十分关键。当前的方法主要是基于全卷积神经网络上将不同上下文融合到高层语义部特征中。具体来说,利用全局上下文来改善局部特征的歧义,利用浅层的局部上下文补充空间细节。这些方法在融合全局上下文和局部上下文到每个像素点时都是同等对待的,但是我们认为不同像素点对于全局上下文和局部上下文的需求是不同的。为此,我们提出了自适应上下文网络,通过联合考虑全局和局部上下文在每个像素区域的关联,提出像素感知的上下文捕获策略,自适应地融合全局上下文和局部上下文,从而获得更加有效的场景解析结果。最后实验表明了我们方法的有效性,此外该方法在多个公开的场景解析数据集上(Cityscapes,ADE20k等)均取得同期最好性能。
Spotlight:
分享利用不同上下文的经典方法;
本文提出像素感知的上下文捕获策略,能自适应地融合全局和局部上下文。
1. PARSENET LOOKING WIDER TO SEE BETTER
推荐理由:这篇文章很早采取了全局上下文特征去改进局部区域识别歧义,其文章中深入分析FCN网络引入全局上下文的必要性。此外该文章获得全局上下文特征的方式简单有效,是利用全局上下文特征代表工作,被后续很多分割文章引用。
2. Laplacian Pyramid Reconstruction and Refinement for Semantic Segmentation
推荐理由:这篇文章很早关注到了浅层特征有助于目标边缘细节的恢复,因此设计了拉普拉斯金字塔结构针对性补充边缘细节到高层特征中,逐步改进了目标边缘的分割。这篇文章对于浅层特征的分析以及相关的实验值得关注。