SnailTyan
● 首页
●
分类
●
归档
●
标签
●
关于
Inception-V3论文翻译——中文版
| |
Inception-V3论文翻译——中文版
文章作者:Tyan
博客:noahsnail.com | CSDN | 简书
声明:作者翻译论文仅为学习,如有侵权请联系作者删除博文,谢谢!
翻译论文汇总:https://github.com/SnailTyan/deep-learning-papers-translation
Rethinking the Inception Architecture for Computer Vision
摘要
对许多任务而言,卷积网络是目前最新的计算机视觉解决方案的核心。从2014年开始,深度卷积网络开始变成主流,在各种基准数据集上都取得了实质性
成果。对于大多数任务而言,虽然增加的模型大小和计算成本都趋向于转化为直接的质量收益(只要提供足够的标注数据去训练),但计算效率和低参数
计数仍是各种应用场景的限制因素,例如移动视觉和大数据场景。目前,我们正在探索增大网络的方法,目标是通过适当的分解卷积和积极的正则化来尽
可能地有效利用增加的计算。我们在ILSVRC 2012分类挑战赛的验证集上评估了我们的方法,结果证明我们的方法超过了目前最先进的方法并取得了实质
性收益:对于单一框架评估错误率为:21.2% top-1和5.6% top-5,使用的网络计算代价为每次推断需要进行50亿次乘加运算并使用不到2500万的参数。
通过四个模型组合和多次评估,我们报告了3.5% top-5和17.3% top-1的错误率。
1. 引言
从2012年Krizhevsky等人[9]赢得了ImageNet竞赛[16]起,他们的网络“AlexNet”已经成功了应用到了许多计算机视觉任务中,例如目标检测[5],分割
[12],行人姿势评估[22],视频分类[8],目标跟踪[23]和超分辨率[3]。
这些成功推动了一个新研究领域,这个领域主要专注于寻找更高效运行的卷积神经网络。从2014年开始,通过利用更深更宽的网络,网络架构的质量得到
了明显改善。VGGNet[18]和GoogLeNet[20]在20
网络/计算/评估/方法/卷积/目标/视觉/Net/数据/场景/
网络/计算/评估/方法/卷积/目标/视觉/Net/数据/场景/
-->