机器学习中的学习曲线是什么?


VIP
2025-03-16 12:24:13 (23天前)
  1. 我想知道什么是


学习
</跨度>
曲线


</跨度>

学习
</跨度>
是。绘制它的标准方法是什么?我的意思是我的情节的x轴和y轴应该是什么?

8 条回复
  1. 0# v-star*위위 | 2019-08-31 10-32



    基本上,机器学习曲线允许您找到算法开始学习的点。如果你采用一条曲线,然后在它开始达到常数的点开始构建其学习能力的时候切割一个斜率切线为导数。



    根据x轴和y轴的映射方式,一个轴将开始接近一个常数值,而另一个轴的值​​将继续增加。这是你开始看到一些学习的时候。整条曲线几乎可以让您测量算法能够学习的速率。最大点通常是斜率开始后退。您可以采取多种衍生指标来达到最大/最小点。



    因此,从上面的例子可以看出曲线逐渐趋于恒定值。它最初开始通过训练示例来利用其学习,并且斜率在最大/最小点处变宽,其趋向于越来越接近恒定状态。此时,它能够从测试数据中获取新的示例,并从数据中查找新的独特结果。
    对于纪元与错误,您将有这样的x / y轴度量。


  2. 1# 只怕再见是故人 | 2019-08-31 10-32



    如何确定给定模型是否有更多的培训点有用?对此有用的诊断是学习曲线。


    1. - 预测准确度/误差与训练集大小的关系图(即:模型在预测目标时如何更好地用于训练它的实例数量增加)



    “学习曲线”通常描述当另一个参数(水平轴上)发生变化时,垂直轴上的性能改善,例如训练集大小(机器学习中)或迭代/时间



    学习曲线通常可用于绘制算法健全性检查或提高性能



    学习曲线绘图可以帮助诊断算法将遇到的问题



    就个人而言,以下两个链接帮助我更好地理解这个概念




    学习曲线




    Sklearn学习曲线


  3. 2# ࿏自ོ༾由ོ༽人͙⃡⌇ | 2019-08-31 10-32



    我认为它通常是指一个情节

    预测准确度/误差

    与…相对

    训练集大小

    (即:当用于训练目标的实例数量增加时,模型在预测目标方面有多好)





  4. 3# 日耀九洲 | 2019-08-31 10-32




    我只想简单地说一下这个老问题,指出学习曲线和ROC曲线不是同义词。
    </强>



    如该问题的其他答案所示,a

    学习曲线
    </强>
    传统上描述当另一参数(在水平轴上)有变化时垂直轴上的性能改善,例如训练集大小(机器学习中)或迭代/时间(机器和生物学习中)。一个重点是模型的许多参数在图上的不同点处发生变化。这里的其他答案在说明学习曲线方面做得很好。



    (工业制造中学习曲线的另一个含义是,在20世纪30年代的观察中发现,随着制造单位数量的增加,生产单个单位所需的工时数会以均匀的速度减少。这不是真的相关但值得注意的是完整性并避免网络搜索中的混淆。)



    相反,

    接收器工作特性曲线
    </强>
    , 要么

    ROC曲线
    </强>
    ,不显示学习;它显示了性能。 ROC曲线是分类器性能的图形描绘,其示出了随着分类器的辨别阈值变化而增加的真阳性率(在垂直轴上)和增加的假阳性率(在水平轴上)之间的折衷。因此,只有与模型相关的单个参数(判定/判别阈值)在图上的不同点处发生变化。这条ROC曲线(

    来自维基百科

    )显示了三种不同分类器的性能。






    这里没有描述学习,而是关于两个不同类别的成功/错误的表现,因为分类器的决策阈值变得更宽松/严格。通过查看曲线下方的区域,我们可以看到分类器区分类别的能力的总体指示。这个曲线下面积度量对两个类中的成员数量不敏感,因此如果类成员资格不平衡,它可能无法反映实际性能。 ROC曲线有很多字幕,有兴趣的读者可以查看:




    福西特,汤姆。 “ROC图:研究人员的注释和实际考虑因素。”机器学习31(2004):1-38。




    Swets,John A.,Robyn M. Dawes和John Monahan。 “通过科学做出更好的决定。” Scientific American(2000):83。


  5. 4# 撩心 | 2019-08-31 10-32



    一些人使用“学习曲线”来指代迭代过程的误差作为迭代次数的函数,即,它示出了一些效用函数的收敛。在下面的示例中,我绘制了最小均方(LMS)算法的均方误差(MSE)作为迭代次数的函数。这说明了LMS在这种情况下“学习”信道脉冲响应的速度有多快。







  6. 5# 圈圈红 | 2019-08-31 10-32



    在Andrew的机器学习课程中,学习曲线是训练/交叉验证误差与样本大小的关系图。学习曲线可用于检测模型是否具有高偏差或高偏差。如果模型遭受高偏差问题,随着样本量的增加,训练误差将增加,交叉验证错误将减少,最后它们将彼此非常接近但仍然处于训练和分类错误的高错误率。增加样本量对高偏差问题没有多大帮助。



    如果模型存在较大的方差,随着样本量的不断增加,训练误差将不断增加,交叉验证错误将持续减少,并且最终会出现低训练和交叉验证错误率。因此,如果模型存在高方差,则更多样本将有助于提高模型预测性能。


  7. 6# 不想吃东西 | 2019-08-31 10-32




    X =等级
    Y =薪水



    X Y.
    0 2000年
    2 4000
    4 6000
    6 8000



    回归给出准确率75%它是一个状态线
    由于曲线,多项式给出了85%的准确度




登录 后才能参与评论