收藏本站
《计算机工程与应用》 2018年21期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种结合改进CHI和RFFS的特征选择算法研究

邱宁佳  周稳  王鹏  陶跃  
【摘要】:针对传统CHI算法忽略特征词的词频易导致重要特征词被漏选的问题,结合特征选择时Filter类算法速度快、Wrapper类算法准确率高的特点,提出一种将改进CHI(TDF-CHI)算法与随机森林特征选择(RFFS)相结合的特征选择算法。先利用TDF-CHI算法计算特征词的文档频率及词频与类别的相关程度来进行特征选择,去除冗余特征;再通过RFFS算法度量剩余特征的重要性,进行二次特征选择,优化特征集合,使分类器的性能进一步提升。为了验证改进算法的优越性,利用新闻文本数据,在常用的分类器上进行测试。实验表明,改进算法相比传统CHI算法所选特征词具有更好的分类效果,提高了分类器的准确率和召回率。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 邱宁佳;周稳;王鹏;陶跃;;一种结合改进CHI和RFFS的特征选择算法研究[J];计算机工程与应用;2018年21期
2 陈建华;王治和;蒋芸;许虎寅;樊东辉;;一种改进的文本分类特征选择算法[J];微电子学与计算机;2011年12期
3 孙刚;张靖;;面向高维微阵列数据的集成特征选择算法[J];计算机工程与科学;2016年07期
4 代琨;于宏毅;马学刚;李青;;基于支持向量机的特征选择算法综述[J];信息工程大学学报;2014年01期
5 郭磊;王亚弟;陈庶樵;朱珂;伊鹏;;一种改进的动态流特征选择算法[J];计算机工程与应用;2012年18期
6 陈晓明;;海量高维数据下分布式特征选择算法的研究与应用[J];科技通报;2013年08期
7 袁轶;王新房;;一种基于方差的文本特征选择算法[J];计算机工程;2012年12期
8 胡佳妮,徐蔚然,郭军,邓伟洪;中文文本分类中的特征选择算法研究[J];光通信研究;2005年03期
9 王正群;侯艳平;邹军;马波;;改进的特征选择算法[J];计算机工程与设计;2008年22期
10 张晓光;孙正;徐桂云;阮殿旭;;一种类内方差与相关度结合的特征选择算法[J];哈尔滨工业大学学报;2011年03期
11 杨亲瑶;余国先;吕乐;;一种基于谱理论的并行特征选择算法[J];计算机应用与软件;2010年11期
12 张巍,邹翔,吴晓如;分类问题的一种可伸缩特征选择算法[J];计算机学报;2005年07期
13 宇文旋;卢满怀;;用于轴承表面缺陷分类的特征选择算法[J];轴承;2018年01期
14 焦娜;;基于分割策略的特征选择算法[J];计算机科学;2018年10期
15 刘帅;杨英杰;刘武越;;一种面向聚类的加权特征选择算法[J];计算机应用研究;2015年12期
16 易军凯;田立康;;基于类别区分度的文本特征选择算法研究[J];北京化工大学学报(自然科学版);2013年S1期
17 王国胤;罗川江;;基于置换检验的两步基因特征选择算法[J];重庆邮电大学学报(自然科学版);2012年04期
18 张彪;刘贵全;;基于关联分析的文本分类特征选择算法[J];计算机工程;2010年22期
19 孙勤;蒋艳凰;胡维;张毅;高峰;;多准则赋权排序与C-SVM相结合的特征选择算法[J];计算机工程与应用;2018年03期
20 夏虎;庄健;周璠;于德弘;;采用多目标进化模型的无监督故障特征选择算法[J];振动与冲击;2014年08期
中国重要会议论文全文数据库 前9条
1 甄超;郑涛;许洁萍;;音乐流派分类中特征选择算法研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
2 张仰森;曹元大;;最大熵建模方法中一种改进的特征选择算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
3 张铮;胡社教;江萍;;基于EP模式的特征选择算法[A];2011中国仪器仪表与测控技术大会论文集[C];2011年
4 周炎涛;唐剑波;王家琴;;基于信息熵的改进TFIDF特征选择算法[A];第二十六届中国控制会议论文集[C];2007年
5 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 李政泽;韩毅;周斌;贾焰;;微博用户分类的特征词权重优化及推荐策略[A];第27次全国计算机安全学术交流会论文集[C];2012年
7 苏祺;孙斌;;面向观点挖掘的产品评价特征词识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 罗海飞;虞立群;章志凌;邵晓敏;陈林;汪更生;陈弈秋;何伟杰;;一种改进型CHI的特征抽取方法[A];第二十四届中国控制会议论文集(下册)[C];2005年
9 王俞霖;孙乐;李文波;;基于“VASE”特征词的网络查询分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前8条
1 李云;特征选择算法及其在基于内容图像检索中的应用研究[D];重庆大学;2005年
2 张靖;面向高维小样本数据的分类特征选择算法研究[D];合肥工业大学;2014年
3 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
4 杨杰明;文本分类中文本表示模型和特征选择算法研究[D];吉林大学;2013年
5 史彩娟;网络空间图像标注中半监督稀疏特征选择算法研究[D];北京交通大学;2015年
6 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
7 耿耀君;高通量数据特征选择算法研究[D];西安电子科技大学;2013年
8 郝立丽;汉语文本数据挖掘[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 郭杰;基于词条分布的特征选择算法在文本分类中的研究与应用[D];西安理工大学;2016年
2 付鑫;基于改进型特征选择算法的文本分类方法研究[D];山东师范大学;2018年
3 刘艺彬;基于分词频的特征选择算法在文本分类中的研究[D];西安理工大学;2018年
4 脱倩娟;基于数据相似性的特征选择算法研究[D];闽南师范大学;2018年
5 黄辉;基于ReliefF的多标签特征选择算法研究[D];广东工业大学;2018年
6 李叶紫;基于互信息和贝叶斯最优化的两种特征选择算法[D];广东工业大学;2018年
7 刘炉;多标签分类中特征选择算法的研究[D];合肥工业大学;2017年
8 张婧虹;混合数据的核密度估计熵与快速的贪心特征选择算法[D];浙江大学;2017年
9 王俊;基于原型方法的特征选择算法的研究[D];哈尔滨工业大学;2009年
10 崔春燕;组特征选择算法及其应用研究[D];南京师范大学;2013年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978