收藏本站
《计算机工程与设计》 2011年12期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

改进的基于内容的文件类型识别算法

曹鼎  罗军勇  
【摘要】:在现有基于内容的文件类型识别算法基础上,针对统计特征提取方面存在的问题,采用定长和变长窗口对文件二进制内容进行划分,提取文件的统计特征,并提出将特征选择应用于文件类型识别,结合特征的广度和稳定度设计出一种特征选择评估函数选择标志特征,从而建立文件类型模型,以此为标准识别文件类型。该算法不依靠特定文件类型的结构和关键标识,适用范围更为广泛。实验结果表明,该算法能有效提高文件类型的识别查准率和查全率。
【作者单位】解放军信息工程大学信息工程学院;
【分类号】:TP391.41

【共引文献】
中国硕士学位论文全文数据库 前1条
1 徐亚娟;基于公安业务信息的文本挖掘技术研究与实现[D];浙江大学;2008年
【同被引文献】
中国博士学位论文全文数据库 前1条
1 曾令仿;基于对象的网络存储智能处理方法研究[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前1条
1 鲁春怀;基于对象存储设备的文件系统及安全机制的研究[D];华中科技大学;2006年
【二级参考文献】
中国期刊全文数据库 前7条
1 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
2 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期
3 张玉芳;彭时名;吕佳;;基于文本分类TFIDF方法的改进与应用[J];计算机工程;2006年19期
4 王秀娟,郭军,郑康锋;文本分类中一种新的特征选择方法[J];计算机应用;2005年03期
5 刘斌,黄铁军,程军,高文;一种新的基于统计的自动文本分类方法[J];中文信息学报;2002年06期
6 张海龙;王莲芝;;自动文本分类特征选择方法研究[J];计算机工程与设计;2006年20期
7 柴玉梅;王宇;;基于TFIDF的文本特征选择方法[J];微计算机信息;2006年24期
【相似文献】
中国期刊全文数据库 前10条
1 曹鼎;罗军勇;尹美娟;;基于变长元组的文件类型识别算法[J];计算机应用;2011年07期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026