PROSAGA码农传奇-深度学习-使用R-CNN进行物体检测？

<div class =“post-text”itemprop =“text”>
  
    R-CNN是所有提到的算法的爸爸算法，它确实为研究人员提供了在其上构建更复杂和更好的算法的途径。我试图解释R-CNN及其他变种。
  
  <H2>
    R-CNN，或基于区域的卷积神经网络
  </H2>
  
    R-CNN包含3个简单步骤：
  
  <UL>
    <LI>
      使用称为选择性搜索的算法扫描输入图像以查找可能的对象，生成~2000个区域提议
    </LI>
    <LI>
      在每个区域提案的基础上运行卷积神经网络（CNN）
    </LI>
    <LI>
      获取每个CNN的输出并将其输入a）SVM以对区域进行分类，以及b）线性回归器以收紧对象的边界框（如果存在这样的对象）。
    </LI>
  </UL>
  
    <a href="https://i.stack.imgur.com/nwVF6.png" rel="noreferrer">
      <img src =“https://i.stack.imgur.com/nwVF6.png”alt =“R-CNN的图片描述”/>
    </A>
  
  <H2>
    快速R-CNN：
  </H2>
  
    快速R-CNN立即跟随R-CNN。快速R-CNN凭借以下几点更快更好：
  
  <UL>
    <LI>
      在提出区域之前对图像执行特征提取，因此仅在整个图像上运行一个CNN而不是2000个CNN - 超过2000个重叠区域
    </LI>
    <LI>
      用softmax层替换SVM，从而扩展神经网络以进行预测，而不是创建新模型。
    </LI>
  </UL>
  
    <a href="https://i.stack.imgur.com/sCtsK.png" rel="noreferrer">
      <img src =“https://i.stack.imgur.com/sCtsK.png”alt =“快速R-CNN的图片描述”/>
    </A>
  
  
    直观地说，删除2000转换层是很有意义的，而是采取一次卷积并在其上制作盒子。
  
  <H2>
    更快的R-CNN：
  </H2>
  
    快速R-CNN的缺点之一是选择性搜索速度慢，而快速R-CNN引入了称为区域提议网络（RPN）的东西。
  
  
    这是RPN的工作：
  
  
    在初始CNN的最后一层，3x3滑动窗口在特征地图上移动并将其映射到较低维度（例如256-d）。对于每个滑动窗口位置，它基于k个固定比率锚点生成多个可能的区域框（默认边界框）
  
  
    每个地区的提案包括：
  
  <UL>
    <LI>
      对该地区和地区的“涣涣”得分
    </LI>
    <LI>
      4个坐标代表该区域的边界框
换句话说，我们会查看上一个要素图中的每个位置，并考虑以它为中心的k个不同的框：高大的框，宽框，大框等。
    </LI>
  </UL>
  
    对于每个框，我们输出我们是否认为它包含一个对象，以及该框的坐标是什么。这是一个滑动窗口位置的样子：
  
  
    <a href="https://i.stack.imgur.com/66ppU.png" rel="noreferrer">
      <img src =“https://i.stack.imgur.com/66ppU.png”alt =“地区提案网络”/>
    </A>
  
  
    2k分数表示每个k个边界框在“对象”上的softmax概率。请注意，虽然RPN输出边界框坐标，但它不会尝试对任何潜在对象进行分类：其唯一的工作仍然是提出对象区域。如果锚箱具有高于特定阈值的“对象”得分，则该框 - 坐标作为区域提议被传递。
  
  
    一旦我们获得了我们的区域提案，我们就会直接将它们提供给基本上是快速R-CNN的内容。我们添加了一个池化层，一些完全连接的层，最后是一个softmax分类层和边界框回归器。从某种意义上说，更快的R-CNN = RPN +快速R-CNN。
  
  
    <a href="https://i.stack.imgur.com/SQVbf.png" rel="noreferrer">
      <img src =“https://i.stack.imgur.com/SQVbf.png”alt =“更快的R-CNN”/>
    </A>
  
  
    的
      链接一些Tensorflow实现：
    </强>
  
  
    <a href="https://github.com/smallcorgi/Faster-RCNN_TF" rel="noreferrer">
      https://github.com/smallcorgi/Faster-RCNN_TF
    </A>
  
  
    <a href="https://github.com/CharlesShang/FastMaskRCNN" rel="noreferrer">
      https://github.com/CharlesShang/FastMaskRCNN
    </A>
  
  
    你可以找到很多Github的实现。
  
  
    的
      附：我从Joyce Xu Medium博客那里借了很多资料。
    </强>
  
</DIV>