收藏本站
《计算机工程与应用》 2011年16期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

新的结合互信息和粗糙集的特征选择

史岳鹏  张明慧  朱颢东  
【摘要】:特征选择是文本分类的一个重要步骤。分析了互信息,针对其不足引进了粗糙集给出了一个基于关系积的属性约简算法,并以此为基础提出了一个新的适用于海量文本数据集的特征选择方法。该方法使互信息进行特征初选,利用基于关系积的属性约简算法消除冗余词。实验结果表明此种特征选择方法的微平均F1和宏平均F1较高。

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 姜祖新;张德贤;张苗;李军军;;基于新型文档频的平均互信息改进研究[J];软件导刊;2012年05期
中国硕士学位论文全文数据库 前2条
1 杜杉;基于特征选择的文件安全监控研究[D];北京交通大学;2012年
2 姜祖新;基于Web的粮食舆情分析关键技术研究[D];河南工业大学;2012年
【参考文献】
中国期刊全文数据库 前4条
1 朱颢东;钟勇;;一种新的基于多启发式的特征选择算法[J];计算机应用;2009年03期
2 寇苏玲;蔡庆生;;中文文本分类中的特征选择研究[J];计算机仿真;2007年03期
3 焦吉成;高学东;王元璞;赵传领;;关系积理论及属性约简算法[J];山东大学学报(工学版);2008年02期
4 张海龙;王莲芝;;自动文本分类特征选择方法研究[J];计算机工程与设计;2006年20期
【共引文献】
中国期刊全文数据库 前10条
1 黄登斌;胡伟文;;一种基于粗集理论的直方图均衡化方法[J];兵工自动化;2010年09期
2 兴连国;许宝杰;;基于粗糙集对旋转机械故障诊断系统的研究[J];北京机械工业学院学报;2006年02期
3 兴连国;许宝杰;;基于粗糙集与BP神经网络的烟气机故障诊断[J];北京机械工业学院学报;2006年04期
4 朱颢东;钟勇;;相容关系的改进及其属性约简[J];北京理工大学学报;2010年01期
5 黄晓莉;曾黄麟;王秀碧;;基于模糊C均值聚类的粗集理论连续属性的离散化新算法[J];重庆邮电学院学报(自然科学版);2006年05期
6 朱颢东;周姝;钟勇;;结合ODF和辨识集的特征选择[J];重庆邮电大学学报(自然科学版);2010年01期
7 曾黄麟;孙勇;陈顺玲;;一种新数控系统温度误差补偿控制方法[J];重庆邮电大学学报(自然科学版);2010年05期
8 万懿;;基于粗糙集的油画评分决策分析[J];赤峰学院学报(自然科学版);2009年01期
9 韦萍萍;;结合ROUGH集的决策树构建方法[J];重庆工学院学报(自然科学版);2007年09期
10 徐卫东;任小洪;周天鹏;乐英高;;基于Matlab-GUI数控机床热误差补偿的仿真系统[J];重庆理工大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前3条
1 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
2 苏蓬;苑津莎;李中;吴建锋;;信息熵约简算法在变压器故障诊断中的应用[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
3 陈桂徐;宋宏;;基于粗糙集理论的少油断路器红外诊断故障研究[A];第三届中国智能计算大会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
2 李睿;信用评估与信用卡欺诈侦测的智能决策系统研究[D];华南理工大学;2011年
3 周斌;基于全寿命周期中小航运企业船舶管理策略研究[D];武汉理工大学;2011年
4 赵方方;定制产品制造过程质量控制与诊断方法研究[D];天津大学;2010年
5 施京华;基于数据挖掘的癌症诊疗决策优化研究[D];上海交通大学;2011年
6 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
7 单建芳;面向事件的文本表示研究[D];上海大学;2012年
8 戴冬雪;国家电容标准的扩展频段计量技术研究[D];哈尔滨工业大学;2006年
9 邓中美;政府投资工程代建合同条件研究[D];重庆大学;2007年
10 丁加明;基于粗糙集理论的膨胀土路基气候作用分析及水毁灾害预测[D];中南大学;2006年
中国硕士学位论文全文数据库 前10条
1 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
2 胡改蝶;中文文本分类中特征选择方法的应用与研究[D];太原理工大学;2011年
3 王俊成;基于RBFNN与D-S理论的数据融合方法及应用研究[D];合肥工业大学;2011年
4 李国佳;汉语全文相似度计算的研究及应用[D];电子科技大学;2011年
5 李萍;覆盖网络的优化与半监督学习[D];安徽大学;2011年
6 严灼;基于内容解析的垃圾邮件过滤技术研究[D];安徽理工大学;2011年
7 刘欣;基于结构信息的中文网页自动分类技术研究[D];南京航空航天大学;2010年
8 匡巧艳;面向G2C交互平台的Web文本挖掘模型和方法研究[D];湖南大学;2009年
9 曹伟;异常行为分析在网络入侵检测中的应用[D];重庆大学;2011年
10 卫莉莉;面向领域的Web文本采集与分类[D];西安建筑科技大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 李刚;雷艾;张弦弦;;涉密网络信息安全保密[J];兵工自动化;2011年01期
2 秦涵书;魏延;曾绍华;;一种基于小生境遗传算法的SVM参数优化方法[J];重庆理工大学学报(自然科学);2011年12期
3 易鸿;;基于贝叶斯算法的神经网络优化方法[J];四川文理学院学报;2010年02期
4 邢丽莉;张兵;谢力;李玥;;Web中文文本分类在防震减灾辅助决策中的应用[J];防灾科技学院学报;2009年04期
5 赵培;牛纪桢;史金艳;;改进的SVM在语音识别文本分类中的应用[J];广西师范大学学报(自然科学版);2009年01期
6 陶伟;;自动文本分类中朴素贝叶斯算法的改进[J];硅谷;2010年01期
7 张瑞民;郭海刚;李培峦;;基于核的k最近邻算法[J];华北水利水电学院学报;2007年06期
8 李叶紫;孙晋豪;王颍洁;;数字化粮情温湿度监控系统[J];北华航天工业学院学报;2010年05期
9 朱颢东;钟勇;;基于新型文档频和优化的Tabu搜索的特征选择[J];华中科技大学学报(自然科学版);2010年02期
10 胡懋智,古红英;各种不同类型的支持向量机及其性能比较分析[J];计算机工程与应用;2005年12期
中国硕士学位论文全文数据库 前1条
1 章栋兵;互联网舆情分析关键技术的研究与实现[D];武汉理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前9条
1 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
2 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期
3 李克文,吴孟达,张雄明;约简的一种启发式算法[J];计算机工程与科学;2004年01期
4 邹娟;周经野;邓成;刘玲;;基于多重启发式规则的中文文本特征值提取方法[J];计算机工程与科学;2006年08期
5 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
6 李粤,李星,刘辉,许静芳;一种改进的文本网页分类特征选择方法[J];计算机应用;2004年07期
7 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
8 寇莎莎,魏振军;自动文本分类中权值公式的改进[J];计算机工程与设计;2005年06期
9 刘江华,程君实,陈佳品;支持向量机训练算法综述[J];信息与控制;2002年01期
中国博士学位论文全文数据库 前1条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 何绍荣;朱颢东;;GA在特征选择中的应用与设计研究[J];计算机工程与应用;2010年27期
2 洪智勇;秦克云;;基于模糊软集合理论的文本分类方法[J];计算机工程;2010年13期
3 徐燕;李锦涛;王斌;孙春明;张森;;文本分类中特征选择的约束研究[J];计算机研究与发展;2008年04期
4 刘海峰;王元元;姚泽清;陈琦;;文本分类中一种基于选择的二次特征降维方法[J];情报学报;2009年01期
5 朱颢东;周姝;钟勇;;基于特征辨别能力和二进制可辨矩阵的特征选择[J];计算机应用与软件;2010年10期
6 王卫玲;孔波;初建崇;杨玫;;一种新的用于文本分类的特征选择算法[J];信息技术与信息化;2009年06期
7 龚静;曾莉;;用于文本分类的特征选择方法[J];湖南环境生物职业技术学院学报;2008年03期
8 吕震宇;赵爽;林永民;;kNN在文本分类中的应用研究[J];计算机与现代化;2008年11期
9 刘洋;;中文文本分类中特征选择方法的比较研究[J];科技信息;2007年03期
10 寇苏玲;蔡庆生;;中文文本分类中的特征选择研究[J];计算机仿真;2007年03期
中国重要会议论文全文数据库 前10条
1 李晓丽;王彤;杜振龙;;基于粗糙集理论的流数据最优特征选择[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 张永;陈思睿;杨志勇;;一种改进的文本分类方法的研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 王秀娟;郭军;郑康锋;;基于互信息可信度的特征选择方法[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
4 徐燕;孙春明;王斌;李锦涛;;基于词条频率的特征选择算法研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
5 徐燕;王斌;李锦涛;孙春明;;知识增益:文本分类中一种新的特征选择方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 陈庆轩;郑德权;郑博文;赵铁军;李生;;中文文本分类中基于文档频度分布的特征选择方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
7 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 肖婷;唐雁;;文本分类中特征选择方法及应用[A];2008年计算机应用技术交流会论文集[C];2008年
9 伍建军;康耀红;;关于文本分类中特征降维方式的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
10 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前10条
1 周晓娟;TD已过分水岭[N];通信产业报;2008年
2 应晓敏 窦文华;技术架构[N];计算机世界;2003年
3 天相投顾 闻群王聃聃;选基金需考虑风险承受力[N];中国证券报;2007年
4 ;栉风沐雨铸辉煌 继往开来谱华章[N];人民邮电;2006年
5 孙志伟;刘刚检查城防林建设[N];齐齐哈尔日报;2008年
6 郑卫东;高产鹅选种方法和标准[N];中国畜牧兽医报;2007年
7 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
8 海通证券 娄静吴先兴;把握风险收益特征选择最适合自己的基金[N];上海证券报;2007年
9 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
10 华泰证券 吴璟;权证投资:只买对的,不买便宜的[N];上海证券报;2008年
中国博士学位论文全文数据库 前10条
1 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
2 张国军;基于粗糙集的相对属性约简算法及决策方法研究[D];华中科技大学;2010年
3 马君华;粗糙集属性约简和聚类算法及其在电力自动化中的应用研究[D];华中科技大学;2010年
4 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
5 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
6 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
7 杨习贝;不完备信息系统中粗糙集理论研究[D];南京理工大学;2010年
8 刘华文;基于信息熵的特征选择算法研究[D];吉林大学;2010年
9 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
10 纪霞;不完备信息系统中粗糙集理论的扩展研究与应用[D];安徽大学;2010年
中国硕士学位论文全文数据库 前10条
1 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
2 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
3 王新丽;中文文本分类系统的研究与实现[D];天津大学;2007年
4 杨打生;特征选择的信息论算法研究[D];东南大学;2005年
5 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
6 孟杰;基于构造性覆盖算法的中文文本分类[D];安徽大学;2007年
7 赵小华;KNN文本分类中特征词权重算法的研究[D];太原理工大学;2010年
8 马宏伟;基于SVM的中文文本分类系统的建模与实现[D];大连理工大学;2006年
9 王小燕;文本分类相关技术与应用研究[D];西北大学;2007年
10 杜圣东;基于多类支持向量机的文本分类研究[D];重庆大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026