收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于特征相关性的特征选择

蒋盛益  王连喜  
【摘要】:提出了一种基于特征相关性的特征选择方法。该方法以特征之间相互依赖程度(相关度)为聚类依据先对特征进行聚类,再从各特征簇中挑选出具有代表性的特征,然后在被选择出来的特征中删除与目标特征无关或是弱相关的特征,最后留下的特征作为最终的特征子集。理论分析表明该方法的运算效率高,时间复杂度低,适合于大规模数据集中的特征选择。在UCI数据集上与文献中的经典方法进行实验比较和分析,结果显示提出的特征选择方法在特征约减和分类等方面具有更好的性能。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 崔自峰;吉小华;;基于线性判别分析的特征选择[J];计算机应用;2009年10期
2 符会涛;卡米力·木衣丁;;一种改进的文本特征选择方法的研究与设计[J];计算机应用与软件;2011年04期
3 符发;;中文文本分类中特征选择方法的比较[J];现代计算机(专业版);2008年06期
4 张成彬;唐建;;基于互信息最大化和特征聚类的特征选择[J];现代计算机(专业版);2009年08期
5 林永民;朱卫东;;模糊kNN在文本分类中的应用研究[J];计算机应用与软件;2008年09期
6 陈素萍;谢丽聪;;一种文本特征选择方法的研究[J];计算机技术与发展;2009年02期
7 林永民;朱卫东;;基尼指数在文本特征选择中的应用研究[J];计算机应用;2007年10期
8 吕震宇;赵爽;林永民;;kNN在文本分类中的应用研究[J];计算机与现代化;2008年11期
9 冯霞;刘志辉;田继存;;基于独立性理论的文本分类特征选择方法[J];计算机工程;2010年12期
10 郭昭辉;刘绍翰;武港山;;基于神经网络的中文文本分类中的特征选择技术[J];计算机应用研究;2006年07期
11 寇苏玲;蔡庆生;;中文文本分类中的特征选择研究[J];计算机仿真;2007年03期
12 黄金杰;常英丽;李阳锋;;基于均匀设计的特征选择方法[J];哈尔滨理工大学学报;2008年01期
13 李慧;李存华;王霞;;文本分类中基于差值思想的多特征选择算法研究[J];微计算机应用;2009年10期
14 周瑞琼;朱颢东;吴洪丽;;基于两种特征贡献度的特征选择[J];河南科技大学学报(自然科学版);2010年05期
15 胡强;;基于两种特征影响度的特征选择[J];微电子学与计算机;2010年12期
16 吕震宇;林永民;赵爽;朱卫东;;基于同义词词林的文本特征选择与加权研究[J];情报杂志;2008年05期
17 孙挺;杨明明;耿国华;周明全;;结合评估函数和Boosting的特征选择方法[J];河南工程学院学报(自然科学版);2008年02期
18 樊康新;;基于多种特征选择的NB组合文本分类器设计[J];计算机工程;2009年24期
19 王明文;付剑波;罗远胜;陆旭;;基于协同聚类的两阶段文本聚类方法[J];模式识别与人工智能;2009年06期
20 冯霞;刘志辉;田继存;;基于假设检验的文本分类特征选择[J];信息与控制;2011年03期
中国重要会议论文全文数据库 前10条
1 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
2 王明文;付剑波;罗远胜;陆旭;;基于协同聚类的两阶段文本聚类方法研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
3 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
7 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 刘怡;高玥;;一种基于文本关键字模型的Audio音乐情感分类方法[A];第四届和谐人机环境联合学术会议论文集[C];2008年
9 胡玉娴;;基于《知网》和遗传算法的中文文本聚类特征选择[A];2009全国计算机网络与通信学术会议论文集[C];2009年
10 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
2 张颖;基于群集智能模式识别方法的研究[D];大连理工大学;2008年
3 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
4 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
5 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
6 李勇明;尿沉渣图像自动识别算法的研究[D];重庆大学;2007年
7 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
8 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
9 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
10 黄东山;特征选择及半监督分类方法研究[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 王新丽;中文文本分类系统的研究与实现[D];天津大学;2007年
2 孟杰;基于构造性覆盖算法的中文文本分类[D];安徽大学;2007年
3 陈超;基于支持向量机的中文文本分类的系统研究[D];武汉理工大学;2007年
4 熊小草;文本分类中特征选择的理论分析和算法研究[D];清华大学;2007年
5 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
6 杨瑞请;基于BPSO的生理信号的情感状态识别[D];西南大学;2008年
7 宋羚;基于多目标遗传算法和SVM的特征选择方法[D];华中科技大学;2007年
8 龚静;中文文本聚类中特征选择算法的研究[D];湘潭大学;2006年
9 凌健;基于SVM的满意特征选择及其在企业信用评估中的应用[D];厦门大学;2007年
10 张鹏招;基于X~2统计的中文文本分类特征选择方法研究[D];重庆大学;2008年
中国重要报纸全文数据库 前10条
1 世纪证券综合研究所 刘昆;业绩与仓位变动相关度不高[N];证券时报;2006年
2 周晓娟;TD已过分水岭[N];通信产业报;2008年
3 本报评论员 戎国彭;股票与期货,哪个离你更近?[N];杭州日报;2008年
4 陈莉;药品包装盒纸板的选择方法[N];中国包装报;2004年
5 联合证券 王慧;中小板保持强势[N];中国证券报;2008年
6 北京 张贵岭;什么是决策时最重要的?[N];电脑报;2010年
7 李云林;美国债券市场的六个特点[N];学习时报;2007年
8 本报记者 丰捷;高校需要准确定位[N];光明日报;2009年
9 记者  彭德倩;机器学习精度提升近6个百分点[N];解放日报;2006年
10 吉宝飞;新年度棉价要看八大因素[N];中华合作时报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978