收藏本站
《中文信息学报》 2006年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于局部共现的查询扩展方法

丁国栋  白硕  王斌  
【摘要】:针对信息检索中文档与查询之间的词不匹配问题,本文提出了一种基于局部共现的查询扩展方法LOCOOC。LOCOOC利用词项与所有查询词在局部文档集合中的共现程度来评估扩展词的质量,并整合了词项在语料集中的全局统计信息,使得选取的扩展词与初始查询所表征的主题或概念具有更好的相关性。实验结果表明:与未进行查询扩展时相比,采用LOCOOC方法进行扩展后,平均准确率提高40%以上;与传统的局部反馈方法以及局部上下文分析方法(LCA,Local ContextAnalysis)相比,LOCOOC不仅具有更优的检索性能,而且有着更好的鲁棒性。

手机知网App
【引证文献】
中国重要会议论文全文数据库 前2条
1 黄名选;严小卫;张师超;;基于完全加权关联规则挖掘的信息检索模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 黄名选;张师超;严小卫;黄发良;;基于用户浏览行为和查询扩展的信息检索模型[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前2条
1 冯运;信息检索中的查询算法研究[D];湖南大学;2007年
2 苏雪峰;隐交互式个性化搜索引擎研究[D];太原理工大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 于剑,程乾生;模糊聚类方法中的最佳聚类数的搜索范围[J];中国科学E辑;2002年02期
2 孔令波;唐世渭;杨冬青;王腾蛟;高军;;XML数据的查询技术[J];软件学报;2007年06期
3 何盈捷,刘惟一;由Markov网到Bayesian网[J];计算机研究与发展;2002年01期
4 王望珍,王先甲,钱耕;不对称信息下物业管理的委托代理分析[J];科技进步与对策;2003年08期
5 王树西;问答系统:核心技术、发展趋势[J];计算机工程与应用;2005年18期
6 吴友政,赵军,段湘煜,徐波;问答式检索技术及评测研究综述[J];中文信息学报;2005年03期
7 袁薇;高淼;;搜索引擎系统中个性化机制的研究[J];微电子学与计算机;2006年02期
8 卢效峰,郑权;基于用户行为分析的搜索引擎模型[J];北方工业大学学报;2004年03期
9 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
10 郭庆琳,樊孝忠,柳长安;基于文本聚类和NLU的自动文摘研究[J];北京理工大学学报;2005年08期
中国博士学位论文全文数据库 前10条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
3 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
4 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年
5 张俊林;基于语言模型的信息检索系统研究[D];中国科学院研究生院(软件研究所);2004年
6 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
7 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
8 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
9 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
10 李云;概念格分布处理及其框架下的知识发现研究[D];上海大学;2005年
中国硕士学位论文全文数据库 前10条
1 翁金象;中文文本分类研究[D];山东大学;2007年
2 张建辉;K-means聚类算法研究及应用[D];武汉理工大学;2007年
3 吴虎子;中文网页获取及自动分类技术研究[D];武汉理工大学;2007年
4 赵志荣;个性化搜索引擎的研究、设计与实现[D];四川大学;2002年
5 孙岩国;基于Internet的中文文本过滤系统的研究与实践[D];兰州理工大学;2004年
6 甘健侯;基于本体的语义Web知识发现及其应用的研究[D];云南师范大学;2004年
7 刘妮娜;Web数据挖掘和个性化搜索引擎研究[D];浙江大学;2005年
8 左家莉;基于Markov网络的信息检索模型[D];江西师范大学;2005年
9 叶凌;基于语义的中文搜索引擎[D];吉林大学;2005年
10 常兴治;基于全局评价的文本分割技术研究[D];东北大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 木合亚提·尼亚孜别克;古力沙吾利;;哈萨克文信息处理的现状和发展方向[J];中文信息学报;2010年04期
2 周程远;朱敏;杨云;;基于词典的中文分词算法研究[J];计算机与数字工程;2009年03期
3 罗杰;陈力;夏德麟;王凯;;基于新的关键词提取方法的快速文本分类系统[J];计算机应用研究;2006年04期
4 朱晓旭;李培峰;朱巧明;刁红军;;一个适用于手持设备的多层汉字输入法模型[J];中文信息学报;2006年06期
5 扎西加;珠杰;;面向信息处理的藏文分词规范研究[J];中文信息学报;2009年04期
6 干俊伟,黄德根;汉语介词短语的自动识别[J];中文信息学报;2005年04期
7 刘云峰,齐欢,Xiang’en Hu,Zhiqiang Cai;潜在语义分析权重计算的改进[J];中文信息学报;2005年06期
8 赵海;揭春雨;;基于有效子串标注的中文分词[J];中文信息学报;2007年05期
9 贾宁;张全;;基于句间关系的汉语语义块省略恢复[J];中文信息学报;2008年06期
10 黄娴;张克亮;;汉语零形回指研究综述[J];中文信息学报;2009年04期
中国重要会议论文全文数据库 前10条
1 宋兰;孙茂松;;中文文本全文查重的实验研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 刘汇丹;芮建武;吴健;;藏文网页的编码识别与转换[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 徐印才;任立群;段元慧;任俊泉;;输血科智能管理系统的开发与应用[A];第四届全国临床检验学术会议论文汇编[C];2006年
4 陈皓;郑利平;刘晓平;;模板在虚拟现实平台中的应用[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
5 唐西隆;;用ToolBook制作多媒体课件的技巧[A];第十五届全国图学教育研讨会暨第七届工程制图CAI课件演示交流会论文集[C];2006年
6 满正行;李应兴;单广荣;于洪志;;网络应用中实现藏文支持的一种方案[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 赵晓波;;基于即时通信的客户服务系统[A];2007年中国通信学会“移动增值业务与应用”学术年会论文集[C];2007年
8 唐永明;王小捷;文娟;;基于关联词的复句语言模型[A];第三届中国智能计算大会论文集[C];2009年
9 朱新河;严新平;萧汉梁;;计算机辅助油液监测数据处理系统[A];第二届全国青年摩擦学学术会议论文专辑[C];1993年
10 彭朝林;;急诊分诊处的计算机应用[A];全国护理临床研究学术交流暨专题讲座会议论文会编[C];2001年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
4 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
5 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
6 撰文 西南证券;计算机应用服务业,随大势而动[N];上海金融报;2008年
7 许伟;金友兵 破局国外办公套件垄断[N];中国企业报;2008年
8 ;浙江天宇信息技术有限公司[N];中国计算机报;2009年
9 兰文科;浅析计算机应用系统平台建设[N];中国国门时报;2007年
10 王伟 潘丽;构建数字海事[N];计算机世界;2006年
中国博士学位论文全文数据库 前9条
1 李苏红;基于实体模型的工程图样数字化设计的研究[D];吉林大学;2007年
2 刘杰;泄漏发射的信息重建与防御对策[D];浙江大学;2004年
3 Memon Abdul Ghafoor;[D];浙江大学;2006年
4 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
5 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
6 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年
7 梁添才;基于认知机理的汉字智能造字研究[D];华南理工大学;2008年
8 卢建平;基于拓扑学和统计学的无字库汉字智能造字研究[D];华南理工大学;2010年
9 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
2 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
3 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
4 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
5 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
6 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
7 徐瑞;一个中文语义语料库的研究与建设[D];苏州大学;2006年
8 沈威;基于渡越矩阵与语境计算模型的复句关系词的自动标注[D];华中师范大学;2007年
9 罗丽俊;中文信息处理中若干技术的研究与实现[D];辽宁科技大学;2008年
10 毋琳;特定领域问答系统中通用语义理解框架的设计与实现[D];河南大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026