很难理解Caffe MNIST的例子

作者: 哦哦了
发布时间: 2024-03-22 11:44:59 (1月前)
转自：

3 条回复

0#
回复此人
庸人自扰 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 关于缺少激活层的问题，您是对的。本教程中的模型缺少激活层。这似乎是对教程的疏忽。对于真正的LeNet-5模型，卷积层之后应该有激活函数。对于MNIST，该模型在没有额外激活层的情况下仍能很好地工作。 </p> <P> 作为参考，在Le Cun的2001年论文中，它指出： </p> <BLOCKQUOTE> <P> 与经典神经网络一样，层数高达F6的单位计算其输入向量与其权重向量之间的点积，并向其添加偏差。这个加权和，表示 <EM> A_I </EM> ，对于单位 <EM> 一世 </EM> 然后，通过sigmoid压扁函数来产生单位状态 <EM> 一世 </EM> ... </p> </BLOCKQUOTE> <P> F6是两个完全连接的层之间的“斑点”。因此，第一个完全连接的层应该应用激活功能（本教程使用ReLU激活函数而不是sigmoid）。 </p> <P> MNIST是神经网络的hello world示例。今天的标准非常简单。单个完全连接的层可以解决该问题，精度约为92％。 Lenet-5比这个例子有了很大的改进。 </p> </DIV>

编辑
1#
回复此人
句号了 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> Caffe使用批处理。该 <code> max_iter </code> 是10,000因为 <code> batch_size </code> 是64岁。 <code> No of epochs = (batch_size x max_iter)/No of train samples </code> 。所以数量 <code> epochs </code> 是近10个。准确度是按照计算的 <code> test data </code> 。是的，由于数据集不是很复杂，模型的准确度确实> 99％。 </p> </DIV>

编辑

登录后才能参与评论