在机器学习中过度拟合术语

作者: 夏花
发布时间: 2025-03-05 04:45:56 (3天前)
转自：

            在书中介绍

机
</跨度>

学习
</跨度>
使用Python（第50页），作者正在对数据集执行线性回归并获取：

训练集得分：0.67
测试集得分：0.66

然后，它们在训练精度和测试精度之间是过度拟合的一个例子。过度拟合就是当

机
</跨度>

学习
</跨度>
模型在新数据上的表现比在训练数据上表现更差。“
我相信引用

4 条回复

0#
回复此人
IP地址 | 2019-08-31 10-32
过度和不合适

你能做的最适合的准确度是
100%
在你的训练集上。
这意味着您的模型学会了预测之前已经看到过的输入。
如果您遇到这种情况，您的测试集可能会表现很差。

您可以通过以下方式检测过度拟合：
- 训练集的高精度
- 训练和测试集之间存在很大差距
您可以通过以下方式检测欠配合：
- 训练集的准确度低（无论测试集的性能如何）
例子：

1）
```
    
      training set score: 0.67
test set score: 0.66
</code>
  
```
此示例在训练集上得分较低。因此，不合适似乎是一个公平的假设。 2） training set score: 0.892 test set score: 0.876 </code> 这个是解释。训练集上的分数非常高，并且在测试集方面存在差距。如果两组中的例子非常相似，那么我会说有一些过度拟合。但是，如果两组完全不同（例如来自不同的来源），那么结果可以被认为是可接受的。
编辑
1#
回复此人
氷寒 | 2019-08-31 10-32

一般来说，它是
的
非常罕见
</强>
建立一个模型，在训练和验证（或测试，或坚持，无论你想称之为什么）集合上表现出相同的表现。因此，训练和验证集之间的差距将（几乎）始终存在。您将经常看到基于间隙的过度拟合的定义，但在实践中它不适用，因为它不是定量的。这里更一般的概念是

“偏差 - 方差权衡”

，你可能想谷歌。相关问题是差距有多大，性能有多好以及验证集的性能如何随着模型的复杂性而变化。

我发现维基百科的这个数字很有启发性：

https://en.wikipedia.org/wiki/Overfitting#/media/File:Overfitting_svg.svg

。 x轴是NN或GBM的训练迭代次数（时期），但您也可以将其视为模型复杂性参数，例如：多项式模型中包含的幂数。如您所见，培训和验证样本的性能之间总是存在差距。但选择不适合的模型的关键是选择
的
最佳权衡
</强>
训练样本的表现（=偏差）与验证样本的表现之间的差异（训练和验证样本的表现之间的差异=差异）。

编辑
2#
回复此人
AsuRa | 2019-08-31 10-32

当训练和测试精度都很低时，就会发生欠拟合。这表示您的模型存在系统性问题，即数据更适合多项式模型，但您使用的是线性模型。因此，训练和测试的准确度约为66％，因为它们都非常低。通常，两组上的高误差表示不合适。

当您在训练中具有相对较高的准确度时会发生过度拟合，但在测试时会降低。这表示您的模型过于适合您的训练数据，并且不能很好地概括为其他数据。通常，训练时的低误差和测试中的较高误差表明过度拟合。

编辑

登录后才能参与评论

在机器学习中过度拟合术语

过度和不合适

例子：