项目作者: Ilikeyou3000
项目描述 :
在用GBDT时发现的模型偏好
高级语言: Python
项目地址: git://github.com/Ilikeyou3000/verify.git
GBDT在处理稀疏数据上的缺点
缺点
如果数据太少,那么要注意规避GBDT🦹画梯形决策面的缺点,本实验以y-x=b为例,在线上的属于一类,在线下的属于另一类,展示拟合决策面效果。
上述逻辑在数据挖掘中可以体现为,(个体观测量-平均观测量)= b(显著)
规避
GBDT大概在数据挖掘里面很有用,尝试将这种线性项相减会获得比较好的决策面。
可以看到,原先像是被咬过的斜决策面,最后和恢复回来的决策面区别还是挺大的
所以数据少的时候,还是尽量不要去拟合带有斜线的逻辑
例子,如下图: