还有一些关于它的文档 caffe.proto文件 ,您可以搜索'ScaleParameter'。
感谢你的帖子堆:)比例层正是我想要的。如果有人想要一个按标量(0.5)缩放然后“添加”-2(并且这些值不应该更改)的图层的示例:
layer { name: "scaleAndAdd" type: "Scale" bottom: "bot" top: "scaled" param { lr_mult: 0 decay_mult: 0 } param { lr_mult: 0 decay_mult: 0 } scale_param { filler { value: 0.5 } bias_term: true bias_filler { value: -2 } } }
(可能这里虽然没有必要使用decay_mult。但是不知道。 看评论。 ) 除此之外:
"param {"
全部取自caffe.proto。并且:我只测试了上面的两个填充值= 1.2。
你可以找到关于caffe的详细文档 这里 。
具体来说,为 "Scale" 分层文档 读 :
"Scale"
计算两个输入Blob的乘积,后一个Blob的形状“广播”以匹配前者的形状。相当于平铺后一个Blob,然后计算元素乘积。 可以省略第二输入,在这种情况下,它被学习为层的参数。
在您的情况下,似乎(单个“底部”),该层学习比例因子乘以 "res2b_branch2b" 。而且,因为 scale_param { bias_term: true } 意味着该层不仅学习乘法缩放因子,还学习常数术语。所以,正面传球计算:
"res2b_branch2b"
scale_param { bias_term: true }
res2b_branch2b <- res2b_branch2b * \alpha + \beta
在训练期间,网络试图学习的价值 \alpha 和 \beta 。
\alpha
\beta