收藏本站
《安徽大学学报(自然科学版)》 2009年05期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于Lucene的互联网文献信息检索系统的研究

王正  陆余良  刘金红  施凡  
【摘要】:论文详述了利用Lucene索引工具包设计和实现的一个互联网文献信息检索系统,给出了系统的设计框架和各个模块的实现技术,并介绍了系统的检索算法.为了使系统支持中英文和各种格式文献检索,论文扩展了Lucene的分词接口和文件分析接口.
【作者单位】电子工程学院网络系604实验室;
【分类号】:TP391.3

【引证文献】
中国期刊全文数据库 前2条
1 朱学芳;冯曦曦;;面向农业主题搜索引擎设计与实现[J];安徽农业科学;2011年35期
2 张安妮;姜华;郝相莲;;面向主题的快速搜索引擎的设计与研究[J];淮阴工学院学报;2011年03期
中国硕士学位论文全文数据库 前1条
1 冯志军;一种科技文章的智能搜索方法[D];中山大学;2010年
【参考文献】
中国期刊全文数据库 前3条
1 赵汀,孟祥武;基于LUCENEAPI的中文全文数据库设计与实现[J];计算机工程与应用;2003年20期
2 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
3 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期
【共引文献】
中国期刊全文数据库 前10条
1 李跃民;王浩;赵生慧;;有词典中文分词算法研究[J];滁州学院学报;2008年03期
2 毛晓蛟;;搜索引擎中网络蜘蛛的研究与实现[J];电脑编程技巧与维护;2010年18期
3 唐波;;网络爬虫的设计与实现[J];电脑知识与技术;2009年11期
4 刘磊安;符志强;;基于Lucene.net网络爬虫的设计与实现[J];电脑知识与技术;2010年08期
5 周民;邱雅;王华彬;;网络舆情分析中智能爬虫的设计[J];电脑知识与技术;2011年33期
6 王岩;;搜索引擎中网络爬虫技术的发展[J];电信快报;2008年10期
7 朱小娟;陈特放;;词频统计中文分词技术的研究[J];仪器仪表用户;2007年03期
8 王坚,赵恒永;专业搜索引擎中文分词算法的实现与研究[J];福建电脑;2005年07期
9 温艳鸿;;基于lucene的文件搜索引擎的设计与扩展[J];福建电脑;2007年08期
10 邵孟;;全文检索技术研究与设计[J];福建电脑;2012年01期
中国重要会议论文全文数据库 前5条
1 吴晨生;刘彦君;张鲁冀;董晓晴;;科普搜索的研究与实现[A];数字博物馆研究与实践(2009)[C];2010年
2 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
3 柏桂荣;章勇;;基于RSS的用户兴趣模型研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
4 杨喜权;张一鸣;王大勇;;基于特征码的大规模XML文档去重算法研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 单铁城;张安妮;马德辉;;基于爬虫改进算法的个性化搜索引擎应用研究[A];战略性新兴产业与科技支撑——2012年山东省科协学术年会论文集[C];2012年
中国博士学位论文全文数据库 前5条
1 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
2 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
3 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
4 陈家赢;对地观测传感器信息资源建模和管理研究[D];武汉大学;2010年
5 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
2 郭瞳康;基于词典的中文分词技术研究[D];哈尔滨理工大学;2010年
3 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年
4 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
5 陈可钦;基于垂直搜索引擎的主题爬虫算法的研究[D];中南林业科技大学;2009年
6 王兆宇;个性化站内搜索引擎的设计与应用[D];东华大学;2011年
7 赵彦胜;基于web的无线电监测站远程故障诊断系统分析与设计[D];西安电子科技大学;2009年
8 丁士敏;基于Ajax/Lucene的站内搜索技术研究与实现[D];西安电子科技大学;2008年
9 孙华昱;Lucene在医学影像资源检索平台中的应用[D];沈阳工业大学;2011年
10 华大年;手机产品信息垂直搜索引擎系统设计与开发[D];武汉理工大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 刘君伟;张少龙;;浅析搜索引擎原理及使用技巧[J];电脑知识与技术;2009年01期
2 唐波;;网络爬虫的设计与实现[J];电脑知识与技术;2009年11期
3 忻建;范建中;;一种虚拟执行蜘蛛的设计与实现[J];电脑与电信;2009年06期
4 吴育良;;百度中文分词技术浅析[J];河南图书馆学刊;2008年04期
5 吴亮;;搜索引擎中网络爬虫的设计[J];决策与信息(财经观察);2008年07期
6 王树梅,金澎;词间相关性在Web检索中的新应用[J];计算机工程与应用;2002年21期
7 周青,郑泽奇;相关的科技文章的智能搜索[J];计算机工程与应用;2004年12期
8 李勇;韩亮;;主题搜索引擎中网络爬虫的搜索策略研究[J];计算机工程与科学;2008年03期
9 任培花;;J2EE架构与MVC模式下企业内部BBS系统的设计与实现[J];计算机与数字工程;2010年12期
10 林众;;基于MVC的Web应用框架设计与实现[J];科技信息;2010年31期
中国硕士学位论文全文数据库 前9条
1 金琦;基于J2EE的ERP系统研究与应用[D];浙江大学;2002年
2 赵朋;基于Web的用户访问信息挖掘研究[D];东华大学;2006年
3 刘加发;EBM网络搜索引擎的研究与实现[D];大连海事大学;2008年
4 李沛环;基于Lucene的搜索引擎的设计和优化[D];吉林大学;2008年
5 王涛;基于行业的个性化搜索引擎的应用[D];北方工业大学;2008年
6 李一;网络动态专业搜索引擎构建方法的研究[D];东北师范大学;2008年
7 周鹏;农业搜索引擎系统的关键技术研究[D];首都师范大学;2009年
8 林浩;基于电子商务平台的智能搜索引擎研究与设计[D];东北师范大学;2009年
9 董超;基于主题信息服务的垂直搜索引擎的设计与实现[D];北京邮电大学;2010年
【二级参考文献】
中国期刊全文数据库 前6条
1 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期
2 刁倩,张惠惠,王永成;Internet上的英文搜索引擎[J];计算机工程;1999年07期
3 李盛韬,赵章界,余智华;基于主题的Web信息采集系统的设计与实现[J];计算机工程;2003年17期
4 李卫;刘建毅;何华灿;王枞;;基于主题的智能Web信息采集系统的研究与实现[J];计算机应用研究;2006年02期
5 都云程,卢献华;中文搜索引擎现状与展望[J];中文信息学报;1999年03期
6 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期
【相似文献】
中国期刊全文数据库 前10条
1 朱学昊;王儒敬;余锋林;唐昱;;基于Lucene的站内搜索设计与实现[J];计算机应用与软件;2008年10期
2 翟晓玲;潘伟;王波;;基于Lucene的web站内搜索引擎的研究与实现[J];硅谷;2009年12期
3 朱雪莲;;基于Lucene专业搜索引擎的研究应用[J];现代计算机(专业版);2010年09期
4 蓝永健;;基于Lucene的校园网垂直搜索引擎的设计与实现[J];广东教育学院学报;2009年03期
5 钟瑞琼;周黎;韩德志;;中小型网站站内搜索引擎的设计与实现[J];现代计算机(专业版);2011年08期
6 郑如滨;撒力;谢婷;;基于Heritrix与Lucene的垂直搜索引擎研究[J];电脑知识与技术;2008年29期
7 ;相关专著简介六则[J];中国索引;2003年04期
8 陆科进,李新颖;基于Ontology的文本信息抽取[J];计算机应用研究;2003年07期
9 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
10 王学辉;金丹;;Lucene与关系型数据库对比[J];电脑知识与技术(学术交流);2007年03期
中国重要会议论文全文数据库 前10条
1 崔欣辰;曲宁;陈青华;;隐马尔可夫模型在Web信息抽取中的几点改进[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
2 李纪华;夏薇;;基于XML的web信息提取方法研究[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年
3 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年
5 申兵一;巩青歌;;基于Lucene桌面搜索引擎系统的设计和实现[A];江苏省电子学会2010年学术年会论文集[C];2010年
6 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 徐林昊;杨文柱;陈少飞;郝亚南;李天柱;;基于XPath的Web信息抽取[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
8 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
9 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 彭芳;搜索也专业[N];中国计算机报;2004年
3 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
4 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
5 董振东;到用户中去[N];中国计算机报;2003年
6 司静辉;直击数字环境下情报技术发展动向[N];科技日报;2007年
7 任一鸣;垂直搜索:抓住细分需求[N];计算机世界;2007年
8 张友林 甘肃省武威市凉州区中医院;开发中医专用软件很有必要[N];中国中医药报;2009年
9 马志彦;悄然而至的EIP[N];中国计算机报;2002年
10 本报记者 于翔;BI:电信业渗透中[N];网络世界;2004年
中国博士学位论文全文数据库 前10条
1 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
2 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
3 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
4 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
5 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
6 张乃洲;实体搜索爬虫和信息抽取研究[D];武汉大学;2011年
7 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
8 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
9 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
10 滕伟;面向Web信息集成的Web信息抽取中若干关键问题的研究[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 李文泽;个性化垂直搜索引擎研究[D];河南大学;2007年
2 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
3 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
4 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
5 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
6 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
7 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
8 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
9 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
10 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026