收藏本站
《计算机工程与应用》 2014年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种融合词语位置特征的Lucene相似度评分算法

白培发  王成良  徐玲  
【摘要】:相似度评分算法是Lucene引擎中的核心部分之一。对Lucene内部的相似度评分算法进行研究分析后,针对Lucene只关心查询词出现的频率,而不关心它们所在的位置这一缺陷提出了一种改进的算法。改进的算法将词语位置关系特征融合到Lucene原始相似度评分算法中。在TREC数据集上的实验结果表明:改进后的算法与Lucene原始算法相比,在MAP和P@n指标上都有一定程度的提高。

手机知网App
【参考文献】
中国期刊全文数据库 前6条
1 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
2 胡长春;刘功申;;面向搜索引擎Lucene的中文分析器[J];计算机工程与应用;2009年12期
3 周新栋,王挺;基于N元语言模型的文本分类方法[J];计算机应用;2005年01期
4 王欢;孙瑞志;;基于领域本体和Lucene的语义检索系统研究[J];计算机应用;2010年06期
5 董刊生;方金云;;基于向量距离的词序相似度算法[J];中文信息学报;2009年03期
6 黄承慧;印鉴;陆寄远;;一种改进的Lucene语义相似度检索算法[J];中山大学学报(自然科学版);2011年02期
【共引文献】
中国期刊全文数据库 前10条
1 陈康;樊孝忠;刘杰;贾可亮;;基于问句语义表征的中文问句相似度计算方法[J];北京理工大学学报;2007年12期
2 毛布;谢汶;;一种基于博弈论的死锁检测机制研究[J];成都电子机械高等专科学校学报;2010年04期
3 杨思春;;一种改进的句子相似度计算模型[J];电子科技大学学报;2006年06期
4 林鸿飞;丁洪文;杨志豪;赵晶;;基于概念和统计的问答系统实现机制[J];大连理工大学学报;2006年02期
5 柴晓丽;张丽伟;管玉玲;;基于HowNet自动文摘的研究[J];电脑编程技巧与维护;2009年S1期
6 穆炜炜;王国才;;主观题自动评阅算法设计[J];电脑知识与技术;2012年15期
7 李从东;高杨;赵映红;;突发事件应急管理中的情景适应度研究[J];电子科技大学学报(社科版);2012年04期
8 杨海天;王健;林鸿飞;;基于特征融合的社区问答问句相似度计算[J];江西师范大学学报(自然科学版);2013年02期
9 姜蕾;董东;;一种古诗词联机评判算法[J];福建电脑;2014年02期
10 李小龙;;基于统计的分词系统字典模型研究[J];湖北工业大学学报;2010年05期
中国重要会议论文全文数据库 前1条
1 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前8条
1 李剑;PSTN话带数据分离与调制识别[D];解放军信息工程大学;2009年
2 彭强;复杂系统远程智能故障诊断技术研究[D];南京理工大学;2004年
3 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
4 张显;信息距离理论及其在问答系统中的应用研究[D];清华大学;2008年
5 邱奇志;基于本体的学习对象发现机制的研究与应用[D];武汉理工大学;2009年
6 钟茂生;基于内容相关度计算的文本结构分析方法研究[D];上海交通大学;2010年
7 邓娜;BPEL流程生命周期中若干关键问题研究[D];北京邮电大学;2011年
8 王芳;基于本体的广域农业信息服务系统关键技术研究[D];河北农业大学;2012年
中国硕士学位论文全文数据库 前10条
1 王森;基于主题树的自上而下文本复制检测研究[D];大连理工大学;2010年
2 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
3 陈旭;地理编码引擎的设计与实现[D];辽宁工程技术大学;2009年
4 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
5 樊春雷;基于语义分析的糖尿病健康教育系统研究与实现[D];华东理工大学;2011年
6 李琼;构件测试信息表示与检索的研究与实现[D];昆明理工大学;2009年
7 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
8 成少梅;利用IRF模型丰富文档的语义代表[D];武汉理工大学;2010年
9 王冬娇;改进的语句相似度算法在问答系统中的应用研究[D];大连交通大学;2010年
10 吴波;改进的编辑距离算法的研究及其在电子政务中的应用[D];电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,张玫杰,姚天顺;一种基于NA假设的训练数据自动构造方法[J];东北大学学报;1999年04期
2 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
3 朱靖波,王宝库,姚天顺;一种规则描述语言NPRDL语言[J];东北大学学报;1996年06期
4 黄河燕,陈肇雄,胡曾剑;IHSMTS中实例模式获取机制的设计与实现[J];计算机研究与发展;2002年05期
5 王长胜,刘群;基于实例的汉英机器翻译系统研究与实现[J];计算机工程与应用;2002年08期
6 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
7 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
8 周法国;杨炳儒;;句子相似度计算新方法及在问答系统中的应用[J];计算机工程与应用;2008年01期
9 宋佳;诸云强;刘润达;;一种基于Lucene改进的全文检索工具包[J];计算机工程与应用;2008年04期
10 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
【相似文献】
中国期刊全文数据库 前10条
1 刘敏华,萧德云;基于相似度的多传感器数据融合[J];控制与决策;2004年05期
2 路迎晨,李兵;一个计算隐马氏模型相似度的改进方法[J];信息与电子工程;2004年04期
3 徐德智;吴军庆;陈建二;赵于前;;一种基于概念信息量的相似度传播算法[J];计算机科学;2009年06期
4 叶永林;杨学强;傅海洋;;装备元数据相似度计算方法研究[J];计算机仿真;2010年04期
5 胡科强;袁志勇;周浩;唐扬;;基于距离相似度的数据关联算法分析[J];武汉理工大学学报;2011年10期
6 张德龙;杨鹏;;相似度技术在资料信息化中的应用研究[J];电子设计工程;2013年03期
7 应文豪;王士同;;基于相似度差的大间隔快速学习模型[J];计算机科学;2013年08期
8 蔡波斯;陈翔;;基于行为相似度的微博社区发现研究[J];计算机工程;2013年08期
9 马小军;赵伟;;改进相似度的分布式个性化推荐[J];计算机工程与应用;2014年04期
10 张星;刘帅;;基于空间向量的电子作业相似度检测的设计与实现[J];福建电脑;2014年02期
中国重要会议论文全文数据库 前10条
1 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陆劲挺;路强;刘晓平;;对比相似度计算方法及其在功能树扩展中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
3 董刊生;方金云;;基于向量距离的词序相似度算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 刘晓平;陆劲挺;;任意功能树的物元相似度求解方法[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
5 王茜;张卫星;;基于分类树相似度加权的协同过滤算法[A];2008年计算机应用技术交流会论文集[C];2008年
6 洪文学;王金甲;常凤香;宋佳霖;刘文远;王立强;;基于图形特征增强的相似度分类器的研究[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(上册)[C];2007年
7 雷庆;吴扬扬;;一种基于语义信息计算XML文档相似度的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统研究[A];第三届学生计算语言学研讨会论文集[C];2006年
9 罗辛;欧阳元新;熊璋;袁满;;通过相似度支持度优化基于K近邻的协同过滤算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
10 王健;刘衍珩;焦玉;;VANETs信任传播建模[A];中国通信学会通信软件技术委员会2009年学术会议论文集[C];2009年
中国重要报纸全文数据库 前1条
1 王伽 卫江;出入境证件照片应及时更换[N];中国国门时报;2008年
中国博士学位论文全文数据库 前7条
1 武威;异质数据相似度学习及其在网络搜索中的应用[D];北京大学;2012年
2 朱娜斐;基于RTT相似度的网络延迟估测理论和方法[D];北京工业大学;2012年
3 钱鹏飞;基于模糊相似度的异构本体映射、合并及校验方法的研究[D];上海交通大学;2008年
4 马海平;基于概率生成模型的相似度建模技术研究及应用[D];中国科学技术大学;2013年
5 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
6 夏云庆;IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现[D];中国科学院研究生院(计算技术研究所);2001年
7 张磊;个性化推荐和搜索中若干关键问题的研究[D];北京邮电大学;2009年
中国硕士学位论文全文数据库 前10条
1 裴运亮;基于切词和语义的中文相似度研究与应用[D];电子科技大学;2011年
2 李磊;虚拟教学实验方案相似度的分析和度量[D];华中科技大学;2009年
3 张东君;网络舆情文摘生成技术中相似度与聚类的研究[D];哈尔滨工程大学;2009年
4 荆路;基于本体的文本相似度研究与实现[D];沈阳工业大学;2009年
5 刘青磊;汉语词语及句子相似度算法研究与应用[D];电子科技大学;2011年
6 伍星宇;基于相似度的社区发现算法研究[D];华中科技大学;2012年
7 刘文龙;基于加权信息熵相似度的协同过滤算法研究[D];天津师范大学;2013年
8 李培;基于《知网》的文本相似度研究[D];河北工业大学;2012年
9 严东宾;基于MULTI-TASK LASSO的英文词对间关系相似度算法[D];华东师范大学;2013年
10 史燕;基于HNC的汉语句子相似度算法的研究[D];江苏大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026