注册
登录
数据防泄漏
在应用交叉验证之前预处理功能而不会泄漏
返回
在应用交叉验证之前预处理功能而不会泄漏
作者:
polo
发布时间:
2024-12-11 04:30:30 (1月前)
转自:
目标编码页面提供了一个避免的解决方法
泄漏 跨度> 从训练折叠到验证折叠:“目标平均值是根据折叠计算的
数据 跨度> 为了防止过度拟合。“所以对给定折叠的预处理不包括在内
数据 跨度> 从这个折叠。 在我看来,这避免了
泄漏 跨度> 从训练样本到测试样本,但相反的情况似乎并非如此。 我可以安全地使用这个
收藏
举报
2 条回复
0#
回复此人
满目山河
|
2019-08-31 10-32
为防止过度拟合,您可以设置
hold_out
训练集的参数为“KFOLD”,测试集的参数为“无”。
有关详细信息,我建议关注
保持类型
关于目标编码的文档部分。
编辑
登录
后才能参与评论