关于样本不平衡问题原因及方案.pdf


立即下载 是吗@
2024-07-21
分类 平衡 上海 分类器 200240 学习 Shanghai 集成 Department Engineering
416 KB

第 4卷第 2期               智  能  系  统  学  报               Vol. 4 №. 2
2009年 4月              CAA I Transactions on Intelligent System s              Ap r. 2009
不平衡分类问题研究综述
叶志飞 1 , 文益民 2 ,吕宝粮 1, 3
(1. 上海交通大学 计算机科学与工程系 ,上海 200240; 2. 湖南工业职业技术学院 信息工程系 ,湖南 长沙 410208;
3. 上海交通大学 智能计算与智能系统教育部微软重点实验室 ,上海 200240)
摘  要 :实际的分类问题往往都是不平衡分类问题 ,采用传统的分类方法 ,难以得到满意的分类效果. 为此 ,十多年
来 ,人们相继提出了各种解决方案. 对国内外不平衡分类问题的研究做了比较详细地综述 ,讨论了数据不平衡性引
发的问题 ,介绍了目前几种主要的解决方案. 通过仿真实验 ,比较了具有代表性的重采样法、代价敏感学习、训练集
划分以及分类器集成在 3个实际的不平衡数据集上的分类性能 ,发现训练集划分和分类器集成方法能较好地处理
不平衡数据集 ,给出了针对不平衡分类问题的分类器评测指标和将来的工作.
关键词 :机器学习 ;不平衡模式分类 ;重采样 ;代价敏感学习 ;训练集划分 ;分类器集成 ;分类器性能评测
中图分类号 : TP181 文献标识码 : A 文章编号 : 167324785 (2009) 0220148209
A survey of imbalanced pattern classif ication problem s
YE Zhi2fei1 ,W EN Yi2m in 2 , LU Bao2liang 1, 3
(1. Department of Computer Science and Engineering, Shanghai J iao Tong University, Shanghai 200240, China; 2. Department of In2
formation Engineering, Hunan Industry Polytechnic, Changsha 410208, China; 3. MO


分类/平衡/上海/分类器/200240/学习/Shanghai/集成/Department/Engineering/ 分类/平衡/上海/分类器/200240/学习/Shanghai/集成/Department/Engineering/
-1 条回复
登录 后才能参与评论
-->