这是非常期待的。 的 这个问题被称为过度拟合 强> 。这是当你的模型开始“记忆”训练样例而不实际学习对测试集有用的任何东西时。事实上,这正是我们首先使用测试集的原因。因为如果我们有足够复杂的模型,我们总能完美地拟合数据,即使没有意义。测试集告诉我们模型实际学到了什么。
它也很有用 的 验证集 强> 这就像一个测试集,但你用它来找出何时停止训练。当验证错误停止降低时,您停止训练。 的 为什么不为此使用测试装置? 强> 测试集将了解您的模型在现实世界中的表现。如果您开始使用测试集中的信息来选择有关您的培训过程的信息,那么就像您的作弊一样,您的测试错误将不再代表您的真实世界错误。
最后, 的 卷积神经网络以其过度拟合的能力而臭名昭着 强> 。已经证明,即使你对标签进行随机播放,Conv-nets也可以获得零训练错误 随机像素 。这意味着Conv-net不必有真正的模式来学习代表它。这意味着 的 你必须规范一个转发网络 强> 。也就是说,你必须使用像 的 退出 强> , 的 批量标准化 强> , 的 提早停止 强> 。
如果你想了解更多,我会留下一些链接:
过度拟合,验证,提前停止 https://elitedatascience.com/overfitting-in-machine-learning
Conv-nets适合随机标签: https://arxiv.org/pdf/1611.03530.pdf (这篇论文有点先进,但它可以轻松浏览)
附:要真正提高测试精度,您需要通过数据扩充来更改模型或训练。您可能也想尝试转学习。