收藏本站
《软件导刊》 2012年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于新型文档频的平均互信息改进研究

姜祖新  张德贤  张苗  李军军  
【摘要】:互信息未考虑单个特征词发生的频率,不仅造成了互信息评价函数倾向于选择特征的稀有词,而且还过滤掉了经常出现的高频词。当特征关键词和类别都增多时,得到的特征关键词与类别之间的平均互信息变小,说明数据在处理过程中去掉了信息,不会创造出新的信息。为此把文档频引进平均互信息,使其对平均互信息的缺点进行修正。实验证明,该方法具有训练和测试速度快,特征提取速度非常快等特点。
【作者单位】河南工业大学信息科学与工程学院;
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 黄秀丽;王蔚;;一种改进的文本分类特征选择方法[J];计算机工程与应用;2009年36期
2 史岳鹏;张明慧;朱颢东;;新的结合互信息和粗糙集的特征选择[J];计算机工程与应用;2011年16期
【共引文献】
中国期刊全文数据库 前3条
1 沈友文;赵新建;徐俊;;一种改进的集中度和分散度文本特征选择算法[J];计算机应用与软件;2011年09期
2 陈功平;沈明玉;王红;张燕平;;基于内容的短信分类技术[J];华东理工大学学报(自然科学版);2011年06期
3 阿力木江·艾沙;吐尔根·依布拉音;艾山·吾买尔;马尔哈巴·艾力;;基于机器学习的维吾尔文文本分类研究[J];计算机工程与应用;2012年05期
【二级参考文献】
中国期刊全文数据库 前5条
1 朱颢东;钟勇;;一种新的基于多启发式的特征选择算法[J];计算机应用;2009年03期
2 寇苏玲;蔡庆生;;中文文本分类中的特征选择研究[J];计算机仿真;2007年03期
3 徐燕;李锦涛;王斌;孙春明;;基于区分类别能力的高性能特征选择方法[J];软件学报;2008年01期
4 焦吉成;高学东;王元璞;赵传领;;关系积理论及属性约简算法[J];山东大学学报(工学版);2008年02期
5 张海龙;王莲芝;;自动文本分类特征选择方法研究[J];计算机工程与设计;2006年20期
【相似文献】
中国期刊全文数据库 前10条
1 仲晓敏;赵雪峰;;基于改进禁忌搜索算法的测试用例自动生成[J];计算机工程与设计;2011年06期
2 苑玮琦;杨冉冉;张开营;;虹膜清晰程度与人眼拍摄距离对应关系研究[J];计算机应用研究;2011年08期
3 苑玮琦;冯素月;;改进的非接触式在线掌纹识别模拟系统[J];光学学报;2011年07期
4 刘岩俊;;基于Tsallis熵的自适应红外图像边缘检测方法[J];微电子学与计算机;2011年07期
5 王玲;陈兵林;刘善军;姬长英;;基于图像特征选择识别田间籽棉品级[J];农业工程学报;2011年07期
6 苏伍各;陶忠祥;董博;;基于WBCT与归一化相关矩阵的红外与可见光图像融合算法[J];计算机应用与软件;2011年09期
7 陈小红;陈晓东;;禁忌搜索算法解决赋权覆盖问题[J];价值工程;2011年26期
8 李文刚;周杰;杨保群;;基于词典和句长及位置的双语对齐方法的改进[J];现代电子技术;2011年14期
9 刘利亮;安平;王贺;张兆杨;;基于公共点提取的多视图像校正[J];信号处理;2011年06期
10 周春燕;贾渊;;基于遗传算法的图像配准研究及改进[J];计算机技术与发展;2011年08期
中国重要会议论文全文数据库 前4条
1 蒋海华;;基于图像清晰度评价函数的显微镜自动调焦技术研究[A];中国兵工学会2008年光学与光电技术交流会论文集[C];2008年
2 戴朝约;冯华君;徐之海;李奇;陶小平;;针对特定场合的图像恢复算法实验研究[A];中国兵工学会2008年光学与光电技术交流会论文集[C];2008年
3 王坤;王磊;游安清;;基于形殊点的动态目标“定位”方法研究[A];第九届全国光电技术学术交流会论文集(下册)[C];2010年
4 张维刚;刘纯熙;黄庆明;蒋树强;;一种基于图像质量评价的视频Dissolve检测方法[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
中国博士学位论文全文数据库 前10条
1 张慧杰;面向大数据集的地形模型多分辨率建模关键技术研究[D];吉林大学;2009年
2 于保军;基于显微视觉的微操作系统及其伺服控制研究[D];吉林大学;2008年
3 胡涛;机器视觉中的自动调焦及形貌恢复技术研究[D];哈尔滨工业大学;2007年
4 谭志国;点模式匹配及应用研究[D];国防科学技术大学;2008年
5 徐敏;基于博弈思想的优化算法研究[D];中国科学技术大学;2006年
6 左平;虹膜图像恢复算法的研究[D];吉林大学;2008年
7 康玲;药物分子对接优化模型与算法研究[D];大连理工大学;2009年
8 王丽娟;基于特征评价的模式识别算法研究[D];哈尔滨工业大学;2007年
9 潘冠宇;基于粗糙集和群体智能的数据挖掘方法研究[D];吉林大学;2007年
10 董杰;基于单目视觉的散焦测距算法的研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 周宇;脱机手写中文识别中粘连文本行的切分与提取[D];哈尔滨工业大学;2007年
2 刘涛;基于FPGA的图像采集、显示与调焦系统设计[D];西北大学;2011年
3 王彦芳;自动聚焦系统中评价函数性能与动态区域选取的研究[D];山东大学;2011年
4 徐健峰;基于手持式图像采集系统的自动聚焦研究[D];浙江大学;2007年
5 刘小飞;多目标概率规划算法的研究与实现[D];东北师范大学;2009年
6 吕红良;基于大规模语料库的中文新词识别[D];大连理工大学;2008年
7 周影;基于空间认知的路径查找模型的设计与实现[D];陕西师范大学;2008年
8 徐亮;中文新词识别研究[D];大连理工大学;2009年
9 李众;双目变焦调焦系统[D];北京理工大学;2011年
10 牛新奇;城市轨道交通换乘票务清分模型的研究[D];华东师范大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026