周志华教授gcForest(多粒度级联森林)算法预测股指期货涨跌 (1).pdf


立即下载 林老爷的日常
2024-09-22
gcForest 样本 参数 类别 Cascade 森林 比例 生成 联森林 训练
1.2 MB

http://blog.csdn.net/woddle/article/details/71122698 1/11
woddle的专栏
 周志华教授gcForest(多粒度级联森林)算法预测股指期货涨跌
对于周志华教授的文章,网上已经有人做出很详细的解释啦。我们对论文进行简单描述之后,然后直
接从策略开始讲起。
gcForest(multi-Grained Cascade forest 多粒度级联森林)是周志华教授最新提出的新的决策树集成
方法。这种方法生成一个深度树集成方法(deep forest ensemble method),使用级联结构让
gcForest学习。gcForest模型把训练分成两个阶段:Multi-Grained Scanning和Cascade Forest。
Multi-Grained Scanning生成特征,Cascade Forest经过多个森林多层级联得出预测结果。
它的表征学习能力可以通过对高维输入数据的多粒度扫描而进行加强。串联的层数也可以通过自适应
的决定从而使得模型复杂度不需要成为一个自定义的超参数,而是一个根据数据情况而自动设定的参
数。值得注意的是,gcForest会比DNN有更少的超参数,更好的一点在于gcForest对参数是有非常
好的鲁棒性,哪怕用默认参数也可以获得很棒的结果。
级联森林(Cascade Forest)
因为决策树其实是在特征空间中不断划分子空间,并且给每个子空间打上标签(分类问题就是一个类
别,回归问题就是一个目标值),所以给予一条测试样本,每棵树会根据样本所在的子空间中训练样
本的类别占比生成一个类别的概率分布,然后对森林内所有树的各类比例取平均,输出整个森林对各
类的比例。例如下图所示,这是根据图1的三分类问题的一个简化森林,每个样本在每棵树中都会找
到一条路径去找到自己对应的叶节点,而同样在这个叶节点中的训练数据很可能是有不同类别的,我
们可以对不同类别进行统计获取各类的比例,然后通过对所有树的比例进行求均值生成整个森林的概
率分布。
原创: 转载:
译文: 评论:
展开
个人资料
woddle
访问:
积分:
等级: 
排名:
文章搜索
文章分类
VC
C++
html
python
嵌入式开发
Linux
人工


gcForest/样本/参数/类别/Cascade/森林/比例/生成/联森林/训练/ gcForest/样本/参数/类别/Cascade/森林/比例/生成/联森林/训练/
-1 条回复
登录 后才能参与评论
-->