收藏本站
《系统仿真学报》 2004年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于分类和关键词组抽取的信息检索算法

钟敏娟  林亚平  陈治平  
【摘要】:本文提出一种基于分类和关键词组抽取的信息检索算法。该算法利用文本分类和信息抽取技术辅助检索,避免了向量空间模型算法中时间复杂度过大,查准率不高的缺点。针对传统的信息检索性能指标无法有效地衡量检索结果的排序状况,本文还引入了排序误差率概念用于评价检索结果的排序。实验结果表明,所提算法与TFIDF算法、基于分类的交互式检索算法相比,具有更快的查询速度,更高的查准率和更小的排序误差率。

手机知网App
【引证文献】
中国博士学位论文全文数据库 前3条
1 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
2 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
3 张登攀;网格环境下可重构测量理论研究[D];华中科技大学;2007年
【共引文献】
中国博士学位论文全文数据库 前10条
1 何因;排序学习中基于直接优化信息检索评价准则算法的理论分析[D];中国科学技术大学;2010年
2 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
3 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
4 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
5 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
6 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
7 温浩宇;制造网格若干关键技术研究[D];西安电子科技大学;2005年
8 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
9 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
10 邓发云;基于用户需求的信息可信度研究[D];西南交通大学;2006年
【同被引文献】
中国博士学位论文全文数据库 前4条
1 李芸;信息科学和信息技术术语概念体系研究[D];北京语言文化大学;2003年
2 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
3 周瑛;神经网络作为分类器的算法研究及在信息检索中的应用[D];安徽大学;2006年
4 高修峰;人脸图像质量评估标准方法研究[D];中国科学技术大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 岳文;陈治平;林亚平;;基于查询扩展和分类的信息检索算法[J];系统仿真学报;2006年07期
2 许增福,梁静国,田晓宇;基于FVSM和自组织映射网络的Web文本自动分类方法[J];哈尔滨工业大学学报;2004年09期
3 郑海,林鸿飞;基于段落匹配的文本分类机制[J];计算机工程与应用;2004年28期
4 王丁,运海红,张辉;文本自动分类系统的研究与实现[J];信息技术;2005年03期
5 杜志文;曾文华;;网格计算在文本分类中的应用[J];微电子学与计算机;2006年S1期
6 崔彩霞;王素格;;基于粗集的支持向量机文本分类方法研究[J];科技广场;2006年08期
7 马忠宝;刘冠蓉;;基于支持向量机的中文文本分类模型研究[J];计算机技术与发展;2006年11期
8 张燕;寒枫;楚红涛;;文本挖掘简述[J];中国电力教育;2006年S3期
9 祝晓鲁;白振兴;贾海燕;;自动文本分类技术研究[J];现代电子技术;2007年03期
10 张桂芸;刘洋;王元元;;基于模糊认知图的文本分类推理算法[J];计算机工程与应用;2007年12期
中国重要会议论文全文数据库 前10条
1 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
4 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 庞剑锋;程学旗;;反馈方法在文本分类系统中的应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
10 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
中国重要报纸全文数据库 前10条
1 琦琦;三大技巧帮中小企业省钱增效[N];中国质量报;2007年
2 王红;雅虎助手掀起智能搜索新潮流[N];科技日报;2006年
3 本报记者  高云杰 本报通讯员  肖瑜 马泳;春运中的四组关键词[N];人民铁道;2007年
4 马蓉于童;从“艰苦朴素”到“盛世华服”[N];齐齐哈尔日报;2008年
5 海磊;雅虎助手掀起智能搜索新潮流[N];中国电脑教育报;2006年
6 田欣;“整合搜索”汇聚搜索流量 提升搜索点进率及黏性[N];中华新闻报;2008年
7 王红;搜索优化 雅虎助手贴心服务网民[N];大众科技报;2006年
8 任才伴 本报记者 韩然;“人才强市”的雄浑乐章[N];沈阳日报;2005年
9 北京大学调研组;百度中文搜索引擎首创竞价排名商业模式[N];国际商报;2008年
10 孟凌声;建设新型产业基地须强力营造新型发展环境[N];人民政协报;2007年
中国博士学位论文全文数据库 前10条
1 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
2 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
3 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
4 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
5 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
6 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
7 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
8 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年
9 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
10 郝立柱;汉语文本自动分类[D];吉林大学;2008年
中国硕士学位论文全文数据库 前10条
1 张彪;文本分类中特征选择算法的分析与研究[D];中国科学技术大学;2010年
2 张保富;基于粗糙集的中文文本分类算法研究及应用[D];江苏大学;2010年
3 蒋健;文本分类中特征提取和特征加权方法研究[D];重庆大学;2010年
4 闫晨;KNN文本分类研究[D];燕山大学;2010年
5 苏小康;基于维基百科构建语义知识库及其在文本分类领域的应用研究[D];华中师范大学;2010年
6 李璇;基于坐标下降法的半监督学习算法及其在文本分类中的应用[D];华南理工大学;2010年
7 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
8 郭志毅;基于EM算法的半监督文本分类方法研究[D];重庆邮电大学;2010年
9 郭明;基于文本分类技术的文本情感倾向性研究[D];郑州大学;2010年
10 段江丽;基于SVM的文本分类系统中特征选择与权重计算算法的研究[D];太原理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026