《测绘科学》2008年03期 加入收藏    获取最新 
 基于Lucene的数据库全文信息检索
 王富强;王青山;张立朝;朱浩群;王锐
   本文深入研究了全文检索引擎Lucene的架构,提出了基于Lucene的数据库全文检索解决方案,并给出了基于Lucene构建全文检索系统的流程图。最后,通过实验对数据库SQL查询和基于Lucene全文检索作了比较。结论证明基于Lucene的数据库全文检索,具有丰富的接口设计和良好的扩展性,适用于海量数据的检索和查询。
【作者单位】:解放军信息工程大学测绘学院;解放军信息工程大学测绘学院;解放军信息工程大学测绘学院;91292部队;解放军信息工程大学测绘学院 郑州450052 78138部队;成都610036;郑州450052;郑州450052;河北高碑店074000;郑州450052
【关键词】:Lucene;全文检索;数据库
【分类号】:P208
【DOI】:CNKI:SUN:CHKD.0.2008-03-068
【正文快照】:
  1引言全文检索是指计算机索引程序通过扫描文章中的每一个词,并建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户[1]。目前信息检索技术正向两个方向发展:一是传统信息检索向全文文本、多媒体、多
 
 推荐 下载CAJ全文           下载PDF全文
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 Database full-text search based on Lucene
 WANG Fu-qiang①②;WANG Qing-shan①;ZHANG Li-chao①;ZHU Hao-qun③;WANG Rui①(① Institute of Surveying and Mapping;Information Engineering University;Zhengzhou 450052;China;② 78138 Troops;Chengdu 610036;China;③ 91292 Troops;Gaobeidian 074000;China)
  The architecture of Lucene,a Full-Text search engine,is studied in this paper.Then the flow chart of the Full-Text search system based on Lucene is presented.The authors also describe the solution about the Full-Text search of database.Finally,by comparing the database's SQL query with the Full-Text search based on Lucene,it shows that the Full-Text search based on Lucene has a richer interface design and better expansibility,which adapts to the amount of data's query and search.It is very important to data mining.
【Keyword】:Lucene;full-text search;database
 【参考文献】 共(2)篇 
 中国期刊全文数据库找到 2 条
 
1周新忠,余木良,陶亮,郭朋飞; 关于地理空间元数据技术发展趋势的理论探讨 [J]; 测绘科学; 2007年02期
2王子彦,陈杰; 检索助力媒体革新 [J]; 中国传媒科技; 2005年03期
 【共引文献】 共(37)篇 
 中国优秀硕士学位论文全文数据库找到 10 条
 
1蒋建洪; 基于分布式的搜索引擎框架研究和实现 [D];西北工业大学; 2007年
2李渊; 面向异步通讯机制的网页搜索技术研究 [D];浙江工商大学; 2007年
3董祥千; 搜索引擎设计分析与结果聚类改进 [D];电子科技大学; 2007年
4黄杰; 基于Lucene的全文检索系统模型的研究 [D];暨南大学; 2007年
5范小源; 搜索引擎系统网页消重的研究与实现 [D];中南民族大学; 2007年
6孙赛赛; 基于JXTA的P2P搜索引擎研究与实现 [D];山东科技大学; 2007年
7柴春轶; 基于Ajax理论的服务器端控件(SCBA)的开发与使用 [D];上海师范大学; 2007年
8吕昊; 面向垂直搜索的聚焦爬虫研究及应用 [D];浙江大学; 2008年
9李洋; 企业注册登记文件聚类软件设计与实现 [D];大连理工大学; 2007年
10罗玫; 基于LUCENE2.0的源代码搜索引擎架构的实现 [D];西北工业大学; 2007年
 中国期刊全文数据库找到 10 条
 
1周平; Lucene全文检索引擎技术及应用 [J]; 重庆工学院学报(自然科学版); 2007年04期
2高凌,熊前兴; 在Web表现层分离表现与数据方法的探讨 [J]; 电脑知识与技术(学术交流); 2007年02期
3潘以锋; 基于Lucene的网站全文检索系统的开发 [J]; 广西教育学院学报; 2006年05期
4王富强,朱浩群,张立朝,龙明,廖迅; 地方志数据库全文信息检索研究 [J]; 测绘通报; 2008年02期
5许璐蕾; 整合开源工具的小型搜索引擎构建 [J]; 电脑知识与技术; 2008年05期
6李武装; 基于语义的企业搜索引擎的研究与实现 [J]; 电脑知识与技术(学术交流); 2007年08期
7胡涛,路红英; 基于Nutch的搜索引擎的研究 [J]; 计算机时代; 2007年01期
8王晓华,杨继隆,吴海洪,姜伟; 基于Ajax的动态刷新及其在车位管理系统中的应用 [J]; 机电工程; 2007年09期
9吴发辉; Ajax技术初探 [J]; 南平师专学报; 2006年04期
10张字平,谢小林; 基于AJAX技术实现搜索引擎中的搜索提示功能 [J]; 东华理工大学学报(自然科学版); 2008年01期
 中国重要会议论文全文数据库找到 3 条
 
1李应兴,付婷,李勇; 基于LUCENE的藏文信息检索的研究与应用 [A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集 [C]; 2007年
2王富强,马德涛,张立朝,王建明; 地方志数据库全文信息检索研究 [A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集 [C]; 2007年
3寇静行,丁立国,贾旭阳; ArcCatalog中的地理元数据的研究 [A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集 [C]; 2007年
 【二级参考文献】 共(14)篇 
 中国优秀硕士学位论文全文数据库找到 1 条
 
1毛海霞; 基于OAI-PMH的空间元数据互操作理论研究与实现 [D];武汉大学; 2004年
 中国博士学位论文全文数据库找到 1 条
 
1辜寄蓉; 基于元数据的综合数据管理与信息共享 [D];成都理工大学; 2003年
 中国期刊全文数据库找到 10 条
 
1程承旗,马廷,任伏虎; 地理元数据软件支撑模式的分析与设计 [J]; 测绘科学; 2001年04期
2崔丽美,谢传节,杨联安,张蕾; 基于XML Schema地球系统科学数据的元数据扩展机制 [J]; 测绘学报; 2005年03期
3袁平,韩景润; 基于元数据面向电子政务的空间信息共享 [J]; 测绘科学; 2005年01期
4董燕,高建国,周新忠; 空间元数据应用的技术探讨 [J]; 测绘信息与工程; 2004年06期
5袁平,韩景润,党海飞; 空间元数据自动生成技术研究 [J]; 地理信息世界; 2005年01期
6姚艳敏,姜作勤,严泰来; 国土资源信息核心元数据的研究 [J]; 测绘学报; 2001年04期
7邢平平,施鹏飞,赵奕; 基于本体论的数据挖掘方法 [J]; 计算机工程; 2001年05期
8王建武; 水利工程地理信息元数据管理系统的基本构架 [J]; 华北水利水电学院学报; 2004年04期
9牛芩涛,盛业华; GeoTIFF图像文件的数据存储格式及读写 [J]; 四川测绘; 2004年03期
10韩夏,李秉严; 元数据的互操作研究 [J]; 情报科学; 2004年07期
 【相似文献】 
 中国期刊全文数据库
 
1权聪敏,赵钊,文福安; 基于Lucene的智能答疑系统的研究与实现 [J];郑州大学学报(理学版); 2007年02期; 53-56
2王海银,王晓民,李莉,孙娜; 硬盘搜索软件在电子档案检索中的应用 [J];城市勘测; 2007年02期; 108-110
3青巴图,付景歆,白加喜; ASP技术在全文检索系统中的应用 [J];黑龙江大学自然科学学报; 2001年02期; 35-36+39
4赵峰; 基于Lucene的全文检索系统初探 [J];黑龙江科技信息; 2007年12期; 68
5张颖,朱大鹏; 基于任意字串的全文检索算法 [J];河南师范大学学报(自然科学版); 2007年01期; 202-205
6谢冬松,李岩; 基于WEB的智能搜索应用技术探讨 [J];中国科技信息; 2007年04期; 132-133
7刘庆明,胡艳胜; 基于WEB搜索引擎的中文问答系统 [J];科技资讯; 2006年04期; 95-96
8王武霞; 基于WEB搜索引擎的中文问答系统 [J];今日科苑; 2006年09期; 120
9张淼; 智能检索及跨库检索技术在数据库建设中的应用研究 [J];科技情报开发与经济; 2005年12期; 239-240
10陈淑燕,瞿高峰; 全文检索系统的数据库设计 [J];延安大学学报(自然科学版); 2001年01期; 34-36+41
 中国优秀硕士学位论文全文数据库
 
1刘兴宇; 基于倒排索引的全文检索技术研究 [D];华中科技大学; 2004年
2江毅铭; 专业搜索引擎索引技术的研究与实现 [D];北京化工大学; 2005年
3郭艳阳; 基于本体论及Lucene的电子公文检索系统 [D];江西财经大学; 2006年
4张校乾; 基于Lucene的全文检索系统的研究与应用 [D];大连理工大学; 2005年
5汪雷东; 四部丛刊电子版的设计与实现 [D];中国科学院研究生院(软件研究所); 2002年
6姜华; 基于Lucene面向主题搜索引擎的研究与设计 [D];华东师范大学; 2007年
7李晓晖; 基于J2EE的文献资料全文检索系统的开发 [D];西南交通大学; 2003年
8于波; 中文全文检索技术研究 [D];华中师范大学; 2003年
9何胜利; 矿山法律法规全文检索系统的研究与应用 [D];西安建筑科技大学; 2005年
10潘亭沥; 基于Lucene的面向商业应用的搜索引擎研究与实现 [D];电子科技大学; 2007年
 中国博士学位论文全文数据库
 
1刘永丹; 文档数据库若干关键技术研究 [D];复旦大学; 2004年
 中国重要会议论文全文数据库
 
1李应兴,付婷,李勇; 基于LUCENE的藏文信息检索的研究与应用 [A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集 [C]; 2007年
2苏亮,孙斌; 一种基于Lucene的Hash改进中文分词算法的实现 [A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册) [C]; 2007年
3赵汀,孟祥武; Lucene全文数据库研究 [A];第六届全国计算机应用联合学术会议论文集 [C]; 2002年
4施水才,肖诗斌,王弘蔚,王洪俊,苏东庄; TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索 [A];辉煌二十年——中国中文信息学会二十周年学术会议论文集 [C]; 2001年
5张英武,杜凯,杨树强,韩伟红; 分布式海量文本检索系统研究 [A];2006年全国开放式分布与并行计算机学术会议论文集(三) [C]; 2006年
6 TRS搜索引擎和文本挖掘系统 [A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编 [C]; 2006年
7 典藏藉数字化嘉惠学林 汉字又在手机展现异彩 [A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编 [C]; 2006年
8周娅,邓珍荣; J2EE环境中的文件管理系统设计与实现 [A];广西计算机学会2006年年会论文集 [C]; 2006年
9施水才,肖诗斌,都云程,王洪俊; TRS中文信息检索技术的发展(摘要) [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年
10 平方爱索互联网智能信息系统 [A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编 [C]; 2006年
 中国重要报纸全文数据库
 
1杨宝昌; 让MySQL支持中文全文检索 [N];计算机世界; 2006年
2温苏刚 姚大红; 在PB中实现全文检索 [N];计算机世界; 2002年
3冯贝; “工”于全文检索的数据库系统 [N];科技日报; 2001年
4宁夏数据通信局 刘君; SQL Server 2000中全文检索的使用 [N];计算机世界; 2002年
5宁夏 刘君; SQL Server中全文检索的使用 [N];电脑报; 2001年
6 大恒FTR全文检索软硬件解决方案 [N];计算机世界; 2001年
7张驰; 发改委启动金宏工程清华同方知网担负研发重任 [N];中国高新技术产业导报; 2007年
8记者 王坤宁; 统计类年鉴加盟年鉴资源数据库 [N];中国新闻出版报; 2007年
9万其鸣; Internet 数据库建设方案比较 [N];计算机世界; 2000年
10本报记者  杨琳桦; 争夺“巴比伦塔” [N];21世纪经济报道; 2006年