收藏本站
《计算机技术与发展》 2019年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于不平衡数据集的改进随机森林算法研究

刘耀杰  刘独玉  
【摘要】:随机森林算法在多种应用场景与数据集中都实现了良好的模型分类效果,但该算法在应用于不平衡二分类数据集时,受限于样本数据量本身的好坏比倾斜与决策子树叶节点投票机制,对样本量占相对少数的小类属样本不能很好地对分类进行表决。对此,文中对原有随机森林算法的节点分类规则进行改进。在模型训练过程中,综合考虑度量节点样本分类占比与节点深度,增加有利于少量类样本分类信息,从而提高了少数样本类的分类准确率。通过在不同数据集上进行随机森林改进算法的效果测试,证明改进算法相对于传统算法在不平衡数据集上有更好的模型表现,大样本条件下少量类样本分类准确率有显著提升。

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 张亮;宁芊;;CART决策树的两种改进及应用[J];计算机工程与设计;2015年05期
2 姚登举;杨静;詹晓娟;;基于随机森林的特征选择算法[J];吉林大学学报(工学版);2014年01期
中国硕士学位论文全文数据库 前3条
1 徐少成;基于随机森林的高维不平衡数据分类方法研究[D];太原理工大学;2018年
2 王天华;基于改进的GBDT算法的乘客出行预测研究[D];大连理工大学;2016年
3 黄小猛;异构代价敏感决策树与随机森林核心技术[D];广西师范大学;2013年
【共引文献】
中国期刊全文数据库 前5条
1 聂斌;郝竹林;桂宝;王卓;杜建强;王国龙;张鑫;;基于随机森林的中药寒、热药性代谢组学判别方法研究[J];江西中医药大学学报;2015年02期
2 郭东锋;胡海洲;汪季涛;姚忠达;杨辉;徐玮;刘新民;;基于随机森林的烤烟香型分类研究[J];中国农学通报;2015年06期
3 郭云;李增元;陈尔学;田昕;凌飞龙;;甘肃黑河流域上游森林地上生物量的多光谱遥感估测[J];林业科学;2015年01期
4 吴思媛;胡幼芬;刘晓伟;荣小静;聂斌;;中药寒热药性分类的随机森林模型研究[J];软件导刊;2014年10期
5 罗军;张俊勇;;树形算法在电信客户细分中的应用研究[J];计算机时代;2014年05期
中国硕士学位论文全文数据库 前10条
1 张潇;基于改进的GBDT的量化投资模型[D];广西大学;2018年
2 刘淼;基于Spark并行框架的推荐系统研究[D];长春理工大学;2018年
3 金圆圆;基于梯度提升决策树的经产妇产后宫缩痛程度的分类研究[D];南昌大学;2018年
4 彭钰;基于集成学习模型在店铺消费人数预测的应用研究[D];上海师范大学;2018年
5 龚洪亮;基于XGBoost算法的武汉市二手房价格预测模型的实证研究[D];华中师范大学;2018年
6 谢冰冰;基于GBM的能源预测知识发现模型研究[D];华中师范大学;2018年
7 范德祥;基于LightGBM的居民出行方式选择模型及应用研究[D];华中科技大学;2018年
8 赵倩芸;高速路口收费站短时车流量预测研究[D];华南理工大学;2018年
9 孙向阳;基于XGBoost算法的窃电用户行为研究[D];兰州交通大学;2018年
10 梁议丹;基于组合模型的酒店线上销量预测的研究[D];西安电子科技大学;2018年
【二级参考文献】
中国期刊全文数据库 前9条
1 刘春英;;基于关联度的代价敏感决策树生成方法[J];长春工业大学学报(自然科学版);2013年02期
2 田晶;艾廷华;丁绍军;;基于C4.5算法的道路网网格模式识别[J];测绘学报;2012年01期
3 姚亚夫;邢留涛;;决策树C4.5连续属性分割阈值算法改进及其应用[J];中南大学学报(自然科学版);2011年12期
4 刘元宁;王刚;朱晓冬;赵正东;陈慧灵;邢翀;;基于自适应多种群遗传算法的特征选择[J];吉林大学学报(工学版);2011年06期
5 陈辉林;夏道勋;;基于CART决策树数据挖掘算法的应用研究[J];煤炭技术;2011年10期
6 吕晓艳;刘春煌;朱建生;;基于关键度度量的决策树算法改进及其在铁路运输中的应用[J];铁道学报;2011年09期
7 李如平;;数据挖掘中决策树分类算法的研究[J];东华理工大学学报(自然科学版);2010年02期
8 乔增伟;孙卫祥;;C4.5算法的两点改进[J];江苏工业学院学报;2008年04期
9 蒋盛益;郑琪;张倩生;;基于聚类的特征选择方法[J];电子学报;2008年S1期
中国硕士学位论文全文数据库 前2条
1 杨浩宇;基于随机森林算法的高维不平衡数据分类研究及应用[D];郑州大学;2017年
2 王雪;面向高维不平衡数据的随机森林算法及其并行化研究[D];辽宁大学;2016年
【相似文献】
中国期刊全文数据库 前10条
1 赵锦阳;卢会国;蒋娟萍;袁培培;柳学丽;;一种非平衡数据分类的过采样随机森林算法[J];计算机应用与软件;2019年04期
2 齐利泉;;基于类中心插值的非均衡数据分类算法[J];通信技术;2019年03期
3 沈智勇;苏翀;周扬;沈智威;;一种面向非均衡分类的随机森林算法[J];计算机与现代化;2018年12期
4 马海荣;程新文;;一种处理非平衡数据集的优化随机森林分类方法[J];微电子学与计算机;2018年11期
5 刘同娟;姜珊;;V-随机森林算法在微博无效评论识别中的应用[J];电脑知识与技术;2019年13期
6 张子誉;;基于机器学习随机森林模型的成绩预测分析[J];科技经济导刊;2018年29期
7 沈智勇;苏翀;沈智威;周扬;;二步轮询的随机森林在睡眠检测的应用[J];信息技术;2018年11期
8 杨晓峰;严建峰;刘晓升;杨璐;;深度随机森林在离网预测中的应用[J];计算机科学;2016年06期
9 赵艺淞;杨昆;王保云;黎晓路;;随机森林在城市不透水面提取中的应用研究[J];云南师范大学学报(自然科学版);2017年03期
10 王婷;;基于随机森林的高光谱遥感图像分类[J];数码世界;2017年05期
中国重要会议论文全文数据库 前5条
1 尤东方;赵杨;;存在混杂时高维数据的随机森林分析[A];2017年中国卫生统计学学术年会论文集[C];2017年
2 许允之;王舒萍;;基于随机森林算法的徐州雾霾回归预测模型[A];《环境工程》2019年全国学术年会论文集[C];2019年
3 王子恒;齐勇刚;刘军;;路面交通标志检测调研:数据集及算法[A];2018中国汽车工程学会年会论文集[C];2018年
4 赵秀宽;阳建宏;黎敏;徐金梧;;一种改进的不平衡数据集分类方法[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
5 肖志博;王焕钢;肖英超;徐文立;;面向大规模数据集的单类支持向量机[A];2013年中国智能自动化学术会议论文集(第三分册)[C];2013年
中国重要报纸全文数据库 前2条
1 本报记者 田新元;人工智能助力保险业智慧化转型[N];中国改革报;2017年
2 记者 罗旭;全球人工智能挑战赛开赛[N];光明日报;2017年
中国博士学位论文全文数据库 前10条
1 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年
2 李宏;面向应用领域的分类方法研究[D];中南大学;2007年
3 房晓南;基于半监督和集成学习的不平衡数据特征选择和分类[D];山东师范大学;2016年
4 张静静;基于不平衡数据集的支持向量机模型与算法研究[D];中国农业大学;2015年
5 严远亭;不完整数据集的多视角集成分类研究[D];安徽大学;2016年
6 张乾;基于随机森林的视觉数据分类关键技术研究[D];华南理工大学;2016年
7 杨智明;面向不平衡数据的支持向量机分类方法研究[D];哈尔滨工业大学;2009年
8 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
9 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
10 杨泽平;基于神经网络的不平衡数据分类方法研究[D];华东理工大学;2015年
中国硕士学位论文全文数据库 前10条
1 程学新;粒子群优化加权随机森林算法研究[D];郑州大学;2017年
2 刘少波;Spark下分类模型研究及其在电网设备故障诊断中应用[D];华北电力大学;2018年
3 杜沛冬;结合卷积神经网络和随机森林的癫痫自动检测[D];山东大学;2018年
4 许远静;病态嗓音特征提取与识别算法的研究[D];广西师范大学;2018年
5 吴裕浩;基于随机森林的椎骨CT图像检测算法研究[D];哈尔滨理工大学;2018年
6 郭松陶;基于深度学习的皮肤病辅助诊断系统[D];中国科学技术大学;2018年
7 庹明暕;基于局部特征融合的分层随机森林表情识别算法[D];华中师范大学;2018年
8 吴迪;基于蚁群算法和随机森林的上位性识别研究[D];吉林大学;2018年
9 王思晨;基于随机森林的不平衡数据分类算法及其并行化研究[D];昆明理工大学;2018年
10 杜续;基于随机森林的PM2.5浓度预测模型研究[D];西安邮电大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026