收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于类别区分互补性的特征选择

王连喜  蒋盛益  
【摘要】:特征选择是机器学习和数据挖掘领域中实现数据降维和数据清理的有效方法之一.针对现有相关性度量方法不能直接度量混合特征(连续特征与离散特征)之间相关性的问题,将连续特征的特征值按照离散特征取值相同的原则进行分组,通过分组前后的数据变异性来度量混合特征之间的相关性.在度量连续特征与类别之间相关性的基础上结合类别区分互补性方法进行特征选择.在UCI数据集上的实验结果表明,提出的混合特征相关性度量方法是有效的、可行的.相比于几种经典的特征选择方法,提出的特征选择方法在特征约减效果及分类性能上都具有优势.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张巍,邹翔,吴晓如;分类问题的一种可伸缩特征选择算法[J];计算机学报;2005年07期
2 郝秀兰;陶晓鹏;王述云;徐和祥;胡运发;;基于特征选择及Condensing技术的文本取样[J];模式识别与人工智能;2009年05期
3 刘斌,曾立波,刘生浩;血液细胞图像自动识别系统的研究[J];计算机工程;2003年01期
4 张惠春;;基于最大熵模型的中文名词短语识别[J];电脑知识与技术;2009年08期
5 王卫玲;孔波;初建崇;杨玫;;一种新的用于文本分类的特征选择算法[J];信息技术与信息化;2009年06期
6 孙雷,王新;一种基于遗传操作和类内类间距离判据理论的特征选择方法[J];计算机工程与应用;2004年21期
7 张向荣,焦李成;基于免疫克隆选择算法的特征选择[J];复旦学报(自然科学版);2004年05期
8 闫相国,明利强;分支定界算法在白细胞特征选择中的应用研究[J];天津职业技术师范学院学报;2004年03期
9 张莉,孙钢,郭军;基于K-均值聚类的无监督的特征选择方法[J];计算机应用研究;2005年03期
10 徐峻岭;徐宝文;张卫丰;崔自峰;;一种启发式聚类特征选择方法(英文)[J];东南大学学报(英文版);2006年02期
11 杨端端;金连文;尹俊勋;;MLDA+LDA:手写汉字识别中一种两级LDA分类方法[J];广西师范大学学报(自然科学版);2006年04期
12 陈卫东;刘素华;;基于遗传算法的图像特征选择[J];计算机工程与应用;2007年28期
13 龚静;曾建一;;文本聚类中的特征选择方法[J];吉首大学学报(自然科学版);2008年02期
14 龚静;曾莉;;用于文本分类的特征选择方法[J];湖南环境生物职业技术学院学报;2008年03期
15 袁剑锋;张启蕊;;医药信息文本分类系统中特征选择模块的研究[J];电脑知识与技术;2008年30期
16 周爽;张钧萍;苏宝库;;基于最速上升算法的超光谱图像波段选择搜索算法[J];计算机应用研究;2008年11期
17 王博;贾焰;杨树强;周斌;;适用于不确定文本分类的特征选择算法[J];通信学报;2009年08期
18 洪亮;;文本分类中特征选择方法研究及分析[J];科技广场;2009年07期
19 康岚兰;董丹丹;;一种改进的互信息特征选择方法[J];电脑知识与技术;2009年35期
20 贾瑞玉;宁再早;耿锦威;查丰;;基于佳点集遗传算法的特征选择方法[J];计算机技术与发展;2011年01期
中国重要会议论文全文数据库 前10条
1 李娜;曾向阳;;目标识别中的样本选择和特征选择联合算法研究[A];2009年西安-上海声学学术会议论文集[C];2009年
2 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 刘怡;高玥;;一种基于文本关键字模型的Audio音乐情感分类方法[A];第四届和谐人机环境联合学术会议论文集[C];2008年
6 胡玉娴;;基于《知网》和遗传算法的中文文本聚类特征选择[A];2009全国计算机网络与通信学术会议论文集[C];2009年
7 于江德;王希杰;余正涛;;基于最大熵模型的语义角色标注[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
8 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 王浩畅;赵铁军;刘延力;于浩;;生物医学文本中命名实体识别的智能化方法[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
10 方高林;于浩;;最大熵语言模型及其在模式识别中新的应用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 韦娜;基于内容图像检索关键技术研究[D];西北大学;2006年
2 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
3 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
4 李勇明;尿沉渣图像自动识别算法的研究[D];重庆大学;2007年
5 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
6 熊文;基于群智的特征选择、分类与聚类挖掘的研究[D];北京邮电大学;2010年
7 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
8 王素格;基于Web的评论文本情感分类问题研究[D];上海大学;2008年
9 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
10 王朝勇;支持向量机若干算法研究及应用[D];吉林大学;2008年
中国硕士学位论文全文数据库 前10条
1 张隆;基于信息论的特征选择和分类算法研究[D];西南农业大学;2005年
2 侯小静;贝叶斯分类器研究及其在Web文档分类中的应用[D];郑州大学;2005年
3 杨打生;特征选择的信息论算法研究[D];东南大学;2005年
4 庞宵;信息熵蚁群算法在特征提取和图像识别中的应用[D];辽宁科技大学;2008年
5 杨瑞请;基于BPSO的生理信号的情感状态识别[D];西南大学;2008年
6 王燕;语音隐写分析技术研究[D];华北电力大学(河北);2009年
7 朱鹏飞;基于粗集理论的人脸识别方法研究[D];山东大学;2005年
8 姚永祥;基于XTM的政务知识导航系统的研究与实现[D];大连理工大学;2006年
9 胡吉祥;基于频繁模式的消息文本聚类研究[D];中国科学院研究生院(计算技术研究所);2006年
10 龚静;中文文本聚类中特征选择算法的研究[D];湘潭大学;2006年
中国重要报纸全文数据库 前9条
1 吴加录;三大搜索引擎仍未满足用户需求[N];中国计算机报;2006年
2 李蓬涛;非结构化视频搜索技术[N];计算机世界;2006年
3 ;微软展示搜索引擎新技术[N];人民邮电;2006年
4 邢小萍;雅虎与微软展开拉锯战[N];网络世界;2008年
5 曹宇杰;业务基础软件平台市场进入快速发展期[N];网络世界;2008年
6 刘小嘉;数字出版:打造出版新架构[N];中国图书商报;2008年
7 孙进;微软“必应”:有限创新如何挑战谷歌?[N];第一财经日报;2009年
8 商报实习记者 李鹏;微软出Bing,有求必应?[N];中国图书商报;2009年
9 于翔;IE 8正式发布 主打安全与速度[N];网络世界;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978