Caffe实施的bvlc_googlenet模型接受的最小图像输入大小是多少?
我正在使用crop_size = 36的50 x 50图像,运行求解器时出现以下错误:
…
经过几个小时试图解决问题后,我想出了为什么我要面对它。 的 GoogleNet 强> 接受 的 224 * 224 强> 默认情况下,图像作为输入,因为它是如此深,并且在一组卷积和池化图层之后,使用了 的 50 * 50 强> 图像(或 的 36 * 36 强> 在将输入传递到某些层之后,将会导致一个非常小的输出 的 内核大小 强> 下一层这将导致类似于我在这里遇到的Reshape异常。
的 解: 强>
虽然它不喜欢编辑 的 kernel_size 强> 导致异常的层的参数(为了继续达到NN的规范),这将解决问题,您可以选择较小的内核大小,然后测试结果直到它工作。
遵循默认值 的 GoogleNet 强> 通过调整输入图像大小的规格 的 254 * 254 强> ( 将作物大小保持在224 )或直接将其更改为 的 224 * 224 强> 并删除 的 crop_size 强> PARAM。