基于深度学习的目标检测最新研究进展总结概述(DL必看).pdf
立即下载
不想吃东西
2025-03-28
目标
检测
图像
位置
学习
深度
区域
介绍
R-CNN
方法
1.9 MB
基于深度学习的目标检测研究进展
开始本文内容之前,我们先来看一下上边左侧的这张图,从图中你看到了什么物体?他
们在什么位置?这还不简单,图中有一个猫和一个人,具体的位置就是上图右侧图像两个边
框(bounding-box)所在的位置。其实刚刚的这个过程就是目标检测,目标检测就是“给定
一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标的具体类别”。
目标检测对于人来说是再简单不过的任务,但是对于计算机来说,它看到的是一些值为
0~255的数组,因而很难直接得到图像中有人或者猫这种高层语义概念,也不清楚目标出现
在图像中哪个区域。图像中的目标可能出现在任何位置,目标的形态可能存在各种各样的变
化,图像的背景千差万别……,这些因素导致目标检测并不是一个容易解决的任务。
得益于深度学习——主要是卷积神经网络(convolution neural network: CNN)和候选区
域(region proposal)算法,从2014年开始,目标检测取得了巨大的突破。本文主要对基于
深度学习的目标检测算法进行剖析和总结,文章分为四个部分:第一部分大体介绍下传统目
标检测的流程,第二部分介绍以R-CNN为代表的结合region proposal和CNN分类的目标检
测框架(R-CNN, SPP-NET, Fast R-CNN, Faster R-CNN); 第三部分介绍以YOLO为代表的
将目标检测转换为回归问题的目标检测框架(YOLO, SSD); 第四部分介绍一些可以提高目标
检测性能的技巧和方法。
一. 传统目标检测方法
2016-05-30 深度学习大讲堂 深度学习大讲堂
如上图所示,传统目标检测的方法一般分为三个阶段:首先在给定的图像上选择一些候
选的区域,然后对这些区域提取特征,最后使用训练的分类器进行分类。下面我们对这三个
阶段分别进行介绍。
(1) 区域选择
这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置,而且目标
的大小、长宽比例也不确定,所以最初采用滑动窗口的策略对整幅图像进行遍历,而且需要
设置不同的尺度,不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置,但
是缺点也是显而易见的:时间复杂度太高,
目标/检测/图像/位置/学习/深度/区域/介绍/R-CNN/方法/
目标/检测/图像/位置/学习/深度/区域/介绍/R-CNN/方法/

-->