收藏本站
收藏 | 投稿 | 论文排版

集成学习的泛化误差和AUC分解理论及其在权重优化中的应用

姜正申  刘宏志  付彬  吴中海  
【摘要】:集成学习是机器学习领域的一个重要分支,其通过整合多个学习器以获得比单个学习器更好的学习效果.多样性和间隔被认为是影响集成学习效果的两个关键因素.现有研究大多是对这两个因素的影响单独进行分析.该文的研究集中于泛化误差、AUC、多样性和间隔之间关系及其在基分类器的权重优化中的应用.该文首先在泛化误差分解理论的基础上,给出了AUC的分解定理.进一步地,该文讨论了泛化误差、AUC、多样性与间隔之间的关系,并指出常用的最大化间隔方法在降低经验误差的同时,也会降低基分类器之间的多样性,进而导致过拟合问题.基于这些理论结果,该文提出了两种新的基分类器的权重优化算法,通过求解一个二次优化问题,实现在准确性和多样性之间的最佳平衡.在35个公开数据集上的实验结果表明,该文所提出的算法在绝大多数情况下都优于现有常用的集成方法.

知网文化
【相似文献】
中国期刊全文数据库 前19条
1 汪丽艳;;局部泛化误差模型的改进及其在特征选择中的应用[J];梧州学院学报;2009年03期
2 崔丽娟;王秋菊;李凯;;加权融合方法的泛化误差分解[J];计算机工程与应用;2008年12期
3 马艳东;;改进的局部泛化误差模型及其在特征选择中的应用[J];中国科技信息;2015年10期
4 刘勇;廖士中;;基于支持向量机泛化误差界的多核学习方法[J];武汉大学学报(理学版);2012年02期
5 凌锦江,陈兆乾,周志华;基于特征选择的神经网络集成方法[J];复旦学报(自然科学版);2004年05期
6 米硕;孙瑞彬;李欣;明晓;;集成学习在文本分类问题中的应用[J];中国新通信;2018年09期
7 李晔;刘胜利;张兆林;;基于漂移检测和集成学习的木马检测模型[J];信息工程大学学报;2017年06期
8 徐继伟;杨云;;集成学习方法:研究综述[J];云南大学学报(自然科学版);2018年06期
9 武玉英;严勇;蒋国瑞;;基于动态选择性集成学习的供应链产销协商优化策略[J];计算机工程;2017年05期
10 张春霞;张讲社;;选择性集成学习算法综述[J];计算机学报;2011年08期
11 张沧生;崔丽娟;杨刚;倪志宏;;集成学习算法的比较研究[J];河北大学学报(自然科学版);2007年05期
12 徐桂云;陈跃;张晓光;刘云楷;;基于选择性集成学习的焊接缺陷识别研究[J];中国矿业大学学报;2011年06期
13 饶峰;;核机器集成学习算法的误差分析[J];重庆文理学院学报(自然科学版);2010年04期
14 王延斌;武优西;刘洪普;;梯度优化决策树的集成学习及其应用[J];计算机科学;2018年S2期
15 吴嘉乐;;异质集成学习器在鸢尾花卉分类中的应用[J];中国设备工程;2018年20期
16 陈德华;吴迪;潘乔;;基于超声特征集成学习的甲状腺结节分类方法研究[J];智能计算机与应用;2016年06期
17 霍东雪;刘辉;尚振宏;李润鑫;;一种异构集成学习的儿科疾病诊断方法研究[J];计算机应用与软件;2018年06期
18 李凯;韩彦霞;;选择策略的集成学习方法研究[J];计算机工程与应用;2011年17期
19 李文娟;胡春生;;基于聚类优化覆盖的集成学习方法[J];计算机技术与发展;2010年11期
中国重要会议论文全文数据库 前4条
1 关鹏洲;王梦毫;李倩;;基于集成学习和深度学习的短期降雨预测模型[A];2017年(第五届)全国大学生统计建模大赛获奖论文选[C];2017年
2 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
3 倪志伟;张琛;倪丽萍;;基于萤火虫群优化算法的选择性集成霾天气预报方法[A];中国系统工程学会第十八届学术年会论文集——A12系统科学与系统工程理论在各个领域中的应用研究[C];2014年
4 李烨;蔡云泽;许晓鸣;;基于支持向量机集成的故障诊断[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
中国博士学位论文全文数据库 前7条
1 赵鹤;面向高维大数据的子空间集成学习方法研究[D];中国科学院大学(中国科学院深圳先进技术研究院);2017年
2 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
3 侯勇;特征提取与集成学习算法的研究及应用[D];北京科技大学;2015年
4 尹华;面向高维和不平衡数据分类的集成学习研究[D];武汉大学;2012年
5 程丽丽;支持向量机集成学习算法研究[D];哈尔滨工程大学;2009年
6 姜震;基于差异的半监督学习中有关算法和理论研究[D];复旦大学;2012年
7 李磊军;基于间隔和置信度的选择性集成学习算法研究[D];哈尔滨工业大学;2014年
中国硕士学位论文全文数据库 前10条
1 曹振田;基于Q统计量的选择性集成学习研究[D];安徽大学;2010年
2 朱飞鸿;基于集成学习的空气质量预测模型分析研究[D];长安大学;2018年
3 郭建威;基于集成学习的不平衡样本分类问题研究[D];哈尔滨工业大学;2017年
4 宋佳智;基于集成学习的膜蛋白金属离子结合位点预测[D];东北师范大学;2018年
5 赵帅;基于集成学习的高斯过程回归软测量建模方法研究[D];江南大学;2018年
6 石玥;基于集成学习的分子吸收能含时密度泛函计算校正模型研究[D];东北师范大学;2018年
7 黎竹平;基于集成学习的特征选择算法的设计与实现[D];哈尔滨工业大学;2018年
8 刘毅;基于集成学习算法的冠心病早期筛查方法研究[D];山东大学;2018年
9 陈羿螢;多分类器融合算法的研究及其在信贷风控中的应用[D];吉林大学;2018年
10 王宏杰;基于聚类集成的半监督分类算法研究[D];西南石油大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978