收藏本站
《南京航空航天大学学报》 2009年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

少数类的集成学习

潘志松  燕继坤  
【摘要】:传统机器学习中研究的分类问题通常假定各类别是平衡的,但在很多场合各类别的出现概率相差很大,而且很多应用中需要区分重要而稀少的少数类。本文比较了3种基于AdaBoost集成学习方法,并推导出他们的精度几何平均(GMA)的下界。分析表明:类别越不平衡,这3种方法越难以通过提高基分类器准确率来提高GMA。在此结论的基础上,以Bagging为基础提出了单边Bagging算法,该算法只对多数类抽样,而保留所有少数类,因而每轮的训练集是类别平衡的,并通过UC I数据集验证了其有效性。

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 吴轶华;集成学习[J];计算机研究与发展;1991年09期
2 梁戎刚;孙蓉晖;蔡庆生;;AILM:一个基于联想的集成学习模型[J];计算机科学;1993年05期
3 姚敏;机器学习及其发展方向[J];计算机时代;1994年04期
4 范慧琳;机器学习的若干方法分析[J];华侨大学学报(自然科学版);1995年01期
5 姚敏,田贤忠;广义计算系统研究[J];计算机工程与应用;1999年01期
6 刘树勋,李卫华,区益善;Internet网络上的智能检索Agent体系结构及其学习方法[J];广东工业大学学报;1999年03期
7 周光明;基于解释学习中的不完善理论问题[J];电脑开发与应用;2004年03期
8 凌锦江,陈兆乾,周志华;基于特征选择的神经网络集成方法[J];复旦学报(自然科学版);2004年05期
9 李国正,杨杰,孔安生,陈念贻;基于聚类算法的选择性神经网络集成[J];复旦学报(自然科学版);2004年05期
10 凌锦江,周志华;基于因果发现的神经网络集成方法[J];软件学报;2004年10期
中国重要会议论文全文数据库 前1条
1 张红梅;高海华;王行愚;;抑制样本噪声的AdaBoost算法及其在入侵检测中的应用[A];2007年中国智能自动化会议论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
2 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
3 向坚;基于三维捕获数据的人体运动分析关键技术研究[D];浙江大学;2007年
4 李成安;分布式环境下聚类分析新方法的研究[D];浙江大学;2006年
5 武晓莉;信息融合及集成学习在水质光谱分析中的应用研究[D];浙江大学;2007年
中国硕士学位论文全文数据库 前10条
1 李新军;基于支持向量机的建模预测研究[D];天津大学;2004年
2 刘晓坤;基于遗传算法的混合学习和集成学习研究[D];天津大学;2003年
3 刘艳霞;基于eEP的稀有类分类问题研究[D];郑州大学;2005年
4 杜健;基于神经遗传学习算法的模型优化研究[D];天津大学;2005年
5 琚旭;支持向量机分类器及其贝叶斯框架研究[D];合肥工业大学;2006年
6 赵万鹏;基于Adaboost算法的数字识别技术的研究与应用[D];中国科学院研究生院(成都计算机应用研究所);2006年
7 常卫东;智能入侵检测中的特征提取和集成学习技术研究[D];国防科学技术大学;2005年
8 王丽丽;集成学习算法研究[D];广西大学;2006年
9 陆朝霞;基于Adaboost算法的行人检测方法研究[D];西北工业大学;2007年
10 易雄鹰;基于计算学习的水淹层识别方法[D];大庆石油学院;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026