过度和不合适
你能做的最适合的准确度是
100%
在你的训练集上。
这意味着您的模型学会了预测之前已经看到过的输入。
如果您遇到这种情况,您的测试集可能会表现很差。
您可以通过以下方式检测过度拟合:
训练集的高精度
训练和测试集之间存在很大差距
您可以通过以下方式检测欠配合:
训练集的准确度低(无论测试集的性能如何)
例子:
1)
training set score: 0.67
test set score: 0.66
</code>
此示例在训练集上得分较低。因此,不合适似乎是一个公平的假设。
2)
training set score: 0.892
test set score: 0.876
</code>
这个是解释。训练集上的分数非常高,并且在测试集方面存在差距。
如果两组中的例子非常相似,那么我会说有一些过度拟合。但是,如果两组完全不同(例如来自不同的来源),那么结果可以被认为是可接受的。