收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于改进的SMOTE采样Catboost分类算法

张德鑫  雒腾  曾志勇  
【摘要】:现实生活中往往存在着不平衡数据现象,而少数类样本通常是我们重点关注的信息。文章通过俄亥俄州真实的医疗数据中存在的不平衡现象,提出了一种新的采样处理方法AK-SMOTE采样方法,即将ALLKNN欠采样技术和SMOTE人过合成过采样技术相结合,同时结合2017年出的应用较为少的Catboost算法,最后通过准确率、查准率、召回率、f1-度量和AUC值作为模型效果的评价指标,结果发现采用AK-SMOTE采样处理之后的Catboost模型在最后的评价指标上相比于其他模型,分类的效果会更好,尤其是在召回率和AUC指标上效果最为明显,也说明了基于AK-SMOTE采样的Catboost分类算法在处理实际生活中存在的不平衡数据问题时有着较为出色的分类效果,对于整个社会具有一定的现实借鉴意义。

知网文化
【相似文献】
中国期刊全文数据库 前16条
1 刘隆和;许俊刚;朱平云;;一种复合自适应分类算法[J];自动化学报;1989年03期
2 段凡丁;;O(n)时间复杂性的超快速分类算法[J];西南交通大学学报;1992年03期
3 孙梦梦;唐旭清;;基于粒度空间的最小生成树分类算法[J];南京大学学报(自然科学);2017年05期
4 吴江;李太勇;刘洋洋;唐常杰;;基于基因表达式编程的代价敏感分类算法[J];吉林大学学报(信息科学版);2009年04期
5 李心宇;李晓航;李志伟;李冬雪;;基于多层感知器神经网络的智能分类算法[J];通信电源技术;2020年05期
6 李晓霞;程伟丽;张雷;张朝阳;;大数据处理中分类算法的数值比较[J];数学的实践与认识;2019年13期
7 党存禄;武文成;李超锋;李永强;;基于CatBoost算法的电力短期负荷预测研究[J];电气工程学报;2020年01期
8 迟铭宇;;社交地点分类算法设计与实现[J];现代计算机(专业版);2017年20期
9 吕铁军;刘传洲;王刘建;;基于多传感器数据融合的目标分类算法[J];航天电子对抗;2013年04期
10 许燕青;;基于属性值贡献度的K最近邻分类算法[J];宁德师范学院学报(自然科学版);2017年02期
11 强保华;唐波;王玉峰;邹显春;柳正利;孙忠旭;谢武;;基于线性回归和属性集成的分类算法[J];计算机科学;2017年06期
12 方辉;;支持向量机多分类算法的研究[J];福建电脑;2009年04期
13 杜慧敏;顾文宁;张霞;;基于FPGA的深度学习分类算法高效实现[J];计算机工程与设计;2019年12期
14 李韬;李平;;一种面向不平衡数据集的组合分类算法[J];电脑与信息技术;2017年04期
15 王波;王怀彬;;基于主动学习的非均衡异常数据分类算法研究[J];信息网络安全;2017年10期
16 赵建华;刘宁;;一种基于样本选择的安全半监督分类算法[J];系统仿真技术;2020年01期
中国重要会议论文全文数据库 前8条
1 靳燕;;高泛化能力的权值控制误分类算法研究[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
2 谢永芳;蒋有为;唐明珠;;一种基于数据剪辑的半监督最邻近分类算法[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
3 赵小强;杨佳敏;;一种基于C4.5的改进TANC分类算法[A];第26届中国控制与决策会议论文集[C];2014年
4 王秀芳;齐玮;慕晓冬;;数据挖掘在故障诊断专家系统知识获取中的应用[A];第十九届中国(天津)'2005IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2005年
5 胡剑锋;包学才;穆振东;;基于相位同步的脑电信号分类算法研究[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
6 葛月月;曾勇;程晨;;一种新的基于局部均值和类均值的近邻分类算法[A];第36届中国控制会议论文集(G)[C];2017年
7 游代安;余旭初;王建荣;;一种基于知识的遥感图像模糊分类算法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
8 马后锋;樊兴华;;一种改进的增量贝叶斯分类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
中国博士学位论文全文数据库 前7条
1 余良俊;属性加权的贝叶斯网络分类算法及其应用研究[D];中国地质大学;2018年
2 刘家辰;集成单类分类算法及其应用研究[D];西安电子科技大学;2015年
3 甘海涛;半监督聚类与分类算法研究[D];华中科技大学;2014年
4 吴广潮;基于聚类特征树的大规模分类算法研究[D];华南理工大学;2012年
5 韩超;面向多义异构数据的分类算法研究[D];华南理工大学;2019年
6 鲁刚;基于机器学习的流量分类算法研究[D];哈尔滨工业大学;2013年
7 徐淑坦;基于多目标差分进化的分子对接算法研究[D];吉林大学;2015年
中国硕士学位论文全文数据库 前10条
1 邹斌;基于生物行为特征及单分类算法的手机用户持续认证研究[D];西南大学;2019年
2 丁伟杰;分类算法在心脏病预诊中的研究[D];西安电子科技大学;2019年
3 包桦楠;基于深度学习的易燃液体分类算法研究与实现[D];成都理工大学;2019年
4 王纪超;基于多标签学习的分类算法研究[D];重庆邮电大学;2019年
5 朱梦;基于机器学习的中文文本分类算法的研究与实现[D];北京邮电大学;2019年
6 段亚军;基于模糊规则的分类算法研究[D];西安电子科技大学;2018年
7 尹红;基于深度学习的花卉图像分类算法研究[D];南昌航空大学;2018年
8 钮满春;基于人工免疫网络的分类算法及其应用[D];西安电子科技大学;2010年
9 孙凯;基于蚁群分类算法的数据分类问题研究[D];合肥工业大学;2013年
10 杨文韬;一种结合万有引力的高光谱遥感影像无监督分类算法[D];成都理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978