收藏本站
收藏 | 投稿 | 论文排版

基于改进信息增益的ACO-WNB分类算法研究

邱宁佳  高鹏  王鹏  陶跃  
【摘要】:针对朴素贝叶斯分类算法对文本分类性能不高的问题,提出一种基于改进信息增益的ACO-WNB分类算法。首先,根据特征词在数据集中的词频分布情况加入调节因子,对特征词的贡献/干扰作用进行增强/抑制的调节,选择具有强区分度的特征形成特征子集,提高IG处理非均衡数据集的准确率。然后,将蚁群优化算法(ACO)和加权朴素贝叶斯模型相结合,利用ACO对权重进行迭代和全局寻优,生成ACO-WNB分类器,提高对文本数据的分类效率。使用典型新闻数据集将改进前后的算法对比分析,实验表明IG (可以有效去除冗余的高频特征,对非均衡数据集有更好的特征选择能力,ACO-WNB分类器具有更高的准确率,使得对实际的文本数据有更好的分类效率。

知网文化
【相似文献】
中国期刊全文数据库 前17条
1 邱宁佳;高鹏;王鹏;陶跃;;基于改进信息增益的ACO-WNB分类算法研究[J];计算机仿真;2019年01期
2 董立岩;李真;周灵艳;;特定信息增益决策森林分类器研究[J];计算机工程与应用;2010年26期
3 李丹华;袁晔;王帅军;;基于数字几何信息增益的服装3D人体特征识别[J];北京服装学院学报(自然科学版);2016年02期
4 白云晖;;基于信息增益特征选取和覆盖的中文文本分类[J];福建电脑;2008年07期
5 任永功;杨荣杰;尹明飞;马名威;;基于信息增益的文本特征选择方法[J];计算机科学;2012年11期
6 任永功;杨雪;杨荣杰;胡志冬;;基于信息增益特征关联树的文本特征选择算法[J];计算机科学;2013年10期
7 潘若愚,韩晓峰;一种基于信息增益的产品评价系统模型[J];合肥工业大学学报(自然科学版);2003年S1期
8 赵一方;裴雷;康乐乐;;基于段落信息增益的政策文本主题识别研究[J];数字图书馆论坛;2018年11期
9 沈红斌;杨杰;刘小军;陈宁江;;基于模糊信息增益的图像相关性度量[J];上海交通大学学报;2006年03期
10 郑惠中;左万利;;基于信息增益与语义特征的多标签社交网络用户人格预测[J];吉林大学学报(理学版);2016年03期
11 李凯齐;刁兴春;曹建军;;基于信息增益的文本特征权重改进算法[J];计算机工程;2011年01期
12 郑麟;;基于贡献因子的改进决策树属性选择方法[J];汕头大学学报(自然科学版);2013年01期
13 陶剑文;赵杰煜;姚奇富;;信息增益区分频繁模式分类方法[J];计算机工程与应用;2009年07期
14 王卓;聂斌;罗计根;;几何平均参与评价划分属性的决策树[J];计算机工程与设计;2018年07期
15 董松月;陈润雨;刘西菩;赵颖莉;马晓宁;;网络民航事件虚假评论的识别研究[J];智能计算机与应用;2016年04期
16 ;更正[J];计算机安全;2014年03期
17 苏志同;李晋宏;王俊山;;一种改进的决策树算法及其应用[J];微计算机信息;2009年30期
中国重要会议论文全文数据库 前6条
1 王孟;白清源;谢丽聪;谢伙生;张莹;;基于信息增益规则排序的关联文本分类[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 陈晶晶;;C4.5经典分类算法的研究与改进[A];荆楚学术2016年第四期 (总第五期)[C];2016年
3 刘鹏;雷蕾;张雪凤;;缺失数据处理方法的比较研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 邓宾;余正涛;韩露;车文刚;郭剑毅;;基于信息增益改进贝叶斯词义消歧模型[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 胡海斌;邱明;姜青山;胡海龙;赵新星;;一种基于数据继承关系的C4.5分类优化算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 陆玉清;洪宇;陆军;姚建民;朱巧明;;基于上下文的真词错误检查及校对方法[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前1条
1 刘哲夫;新型特征选择与机器学习结合方法在化工数据中的应用[D];中国石油大学(北京);2016年
中国硕士学位论文全文数据库 前10条
1 张方钊;基于改进的信息增益和LDA的文本分类研究[D];吉林大学;2018年
2 施欢欢;面向招标项目名称的中文短文本分类技术研究[D];南京财经大学;2017年
3 亓孟雅;基于信息增益的决策树算法的分析与改进[D];华中科技大学;2015年
4 邓蓓蓓;基于信息增益的量化算法及其在决策树中应用的研究[D];广东工业大学;2016年
5 陈小莉;基于信息增益的中文特征提取算法研究[D];重庆大学;2008年
6 王荣;分类技术及其在客户关系管理中的应用[D];浙江大学;2006年
7 朱琳;基于分类算法的用户推荐方法研究及应用[D];北京邮电大学;2017年
8 甄灵敏;基于属性权重和标记记录的实体解析技术[D];东北大学;2013年
9 胡雨晴;基于文本聚类的客户细分方法研究[D];江苏科技大学;2014年
10 彭岳;基于数据挖掘技术的终端机精准营销系统[D];南京大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978