DeconvNet

在FCN发表半年后的ICCV 2015上，DeconvNet针对FCN的部分缺点做了优化，使用反卷积和Unpooling来弥补FCN规定了维度的缺点。其全局的网络结构如下图：

卷积神经网络中的池化层用于从一定的感受野中过滤噪声，提取单一特征，这在分类问题中非常有效。但是在语义分割问题中，细节同样重要，所以Unpooling操作非常有效。Unpooling与池化层相对应，池化层记录好每个结果对应的来源（下标）传递给Unpooling层，如下图所示（绿）。下图（红）示意了反卷积操作，尽管看起来反卷积操作将特征图扩大了，但是DeconvNet中的反卷积层保持特征图不变。特征图的增大时通过Unpooling来实现的。

与FCN相比，这种结构化的反卷积能够获得不同层次的形状和细节，弥补了FCN在特大或特小物体语义分割上的缺陷。

DeconvNet也同样遇到了网络结构复杂、训练样本少的问题。为了解决这个问题，DeconvNet在每个卷积层和反卷积层增加了Batch Normalization。DeconvNet还采用了分段训练的方式，先使用简单的样本训练网络，然后再使用复杂的样本微调网络。为了获得简单的训练样本，先裁剪图片，使得目标物体位于图片中央。在推断时，采用了区域提名的技术来辅助，将多个区域的结果合并作为最终结果呈现。

PreviousFCN NextSegNet

Last updated 5 years ago