在机器学习中过度拟合术语


夏花
2025-03-05 04:45:56 (3天前)
  1. 在书中介绍



</跨度>

学习
</跨度>
使用Python(第50页),作者正在对数据集执行线性回归并获取:

训练集得分:0.67
测试集得分:0.66

然后,它们在训练精度和测试精度之间是过度拟合的一个例子。过度拟合就是当


</跨度>

学习
</跨度>
模型在新数据上的表现比在训练数据上表现更差。“
我相信引用

4 条回复
  1. 0# IP地址 | 2019-08-31 10-32



    过度和不合适



    你能做的最适合的准确度是

    100%

    在你的训练集上。
    这意味着您的模型学会了预测之前已经看到过的输入。
    如果您遇到这种情况,您的测试集可能会表现很差。



    您可以通过以下方式检测过度拟合:




    • 训练集的高精度


    • 训练和测试集之间存在很大差距



    您可以通过以下方式检测欠配合:




    • 训练集的准确度低(无论测试集的性能如何)



    例子:



    1)




    1. training set score: 0.67
      test set score: 0.66

    2. </code>


    此示例在训练集上得分较低。因此,不合适似乎是一个公平的假设。



    2)




    1. training set score: 0.892
      test set score: 0.876

    2. </code>


    这个是解释。训练集上的分数非常高,并且在测试集方面存在差距。



    如果两组中的例子非常相似,那么我会说有一些过度拟合。但是,如果两组完全不同(例如来自不同的来源),那么结果可以被认为是可接受的。


  2. 1# 氷寒 | 2019-08-31 10-32



    一般来说,它是

    非常罕见
    </强>
    建立一个模型,在训练和验证(或测试,或坚持,无论你想称之为什么)集合上表现出相同的表现。因此,训练和验证集之间的差距将(几乎)始终存在。您将经常看到基于间隙的过度拟合的定义,但在实践中它不适用,因为它不是定量的。这里更一般的概念是

    “偏差 - 方差权衡”

    ,你可能想谷歌。相关问题是差距有多大,性能有多好以及验证集的性能如何随着模型的复杂性而变化。



    我发现维基百科的这个数字很有启发性:

    https://en.wikipedia.org/wiki/Overfitting#/media/File:Overfitting_svg.svg

    。 x轴是NN或GBM的训练迭代次数(时期),但您也可以将其视为模型复杂性参数,例如:多项式模型中包含的幂数。如您所见,培训和验证样本的性能之间总是存在差距。但选择不适合的模型的关键是选择

    最佳权衡
    </强>
    训练样本的表现(=偏差)与验证样本的表现之间的差异(训练和验证样本的表现之间的差异=差异)。


  3. 2# AsuRa | 2019-08-31 10-32



    当训练和测试精度都很低时,就会发生欠拟合。这表示您的模型存在系统性问题,即数据更适合多项式模型,但您使用的是线性模型。因此,训练和测试的准确度约为66%,因为它们都非常低。通常,两组上的高误差表示不合适。



    当您在训练中具有相对较高的准确度时会发生过度拟合,但在测试时会降低。这表示您的模型过于适合您的训练数据,并且不能很好地概括为其他数据。通常,训练时的低误差和测试中的较高误差表明过度拟合。


登录 后才能参与评论