收藏本站
《中文信息学报》 2001年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于单汉字索引的全文检索系统的优化研究

余海燕  张仲义  
【摘要】:对于按照单汉字建立倒排索引的全文检索系统 ,最需要解决的问题是如何提高其存储效率和运算速度。本文针对此问题提出了以下优化方法 :一是利用参数化的Golomb编码对倒排文件进行压缩 ;二是对求集合交集的逻辑乘算法进行改进 ;三是运用并行计算和双缓冲技术。实验结果表明 ,经过优化后的单汉字全文检索系统已达到实用化的程度。

【引证文献】
中国期刊全文数据库 前10条
1 李迎;胡晓凤;侯佳路;;浅谈全文检索系统中文档相关性排序问题[J];电子世界;2012年08期
2 熊回香;;试论信息管理与信息系统专业《数据结构》课程的教学[J];高等函授学报(自然科学版);2007年04期
3 张颖;朱大鹏;;基于任意字串的全文检索算法[J];河南师范大学学报(自然科学版);2007年01期
4 黎敏;;基于Oracle的全文检索系统设计与实现[J];科技信息;2009年25期
5 靖培栋;宋雯斐;;全文检索单元词索引技术研究[J];情报理论与实践;2006年01期
6 刘雪芹;吴红霞;张立华;;单汉字全文检索研究[J];情报杂志;2007年01期
7 周强;用Lucene实现MARC记录全文索引之探索[J];图书馆学刊;2005年02期
8 陈定权;Web信息检索技术最新进展[J];现代图书情报技术;2002年02期
9 贺胜;;基于Lucene的中文全文检索系统[J];中国高校科技与产业化(学术版);2006年S3期
10 靖培栋;宋雯斐;;基于混合索引的中文全文检索系统研究[J];中国图书馆学报;2008年01期
中国博士学位论文全文数据库 前1条
1 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 席敏;基于单汉字索引的全文检索系统的研究与实现[D];西安电子科技大学;2010年
2 蒋励;关系数据库中教育信息全文检索效率的改进研究与实现[D];天津师范大学;2011年
3 许志敏;基于Android的桌面搜索引擎的研究与实现[D];哈尔滨工业大学;2010年
4 何胜利;矿山法律法规全文检索系统的研究与应用[D];西安建筑科技大学;2005年
5 翟凤红;商品搜索引擎系统[D];吉林大学;2005年
6 贺胜;面向现代汉语文本处理的全文检索、自动分词通用系统[D];南京师范大学;2006年
7 张晓卫;Web全文信息检索系统的研究与实现[D];苏州大学;2006年
8 韩咏;中文信息检索索引单元的研究[D];哈尔滨理工大学;2006年
9 普东航;基于字节流的全文检索技术研究与实现[D];四川大学;2005年
10 赵会杰;中文全文检索系统中索引的研究[D];北京交通大学;2007年
【参考文献】
中国期刊全文数据库 前5条
1 李培;单汉字标引方法的改进研究[J];情报学报;1999年05期
2 苏新宁;汉语词切分标引算法的改进[J];情报学报;1996年06期
3 苏新宁;中文单字标引算法的改进设想[J];现代图书情报技术;1989年01期
4 王淼;单汉字标引技术的改进研究[J];现代图书情报技术;1997年02期
5 丁蔚;单汉字检索系统后控词表的改进研究[J];现代图书情报技术;1998年05期
【共引文献】
中国期刊全文数据库 前10条
1 任桢;多媒体文献检索系统Sofia No.2的设计实现[J];船电技术;2003年02期
2 王兰成,蒋丹,乐嘉锦;Knowledge Automatic Indexing Based on Concept Lexicon and Segm-entation Algorithm[J];Journal of DongHua University;2005年01期
3 裘江南,金玉玲;试论Internet环境下OPAC系统的发展趋势[J];大学图书馆学报;2000年01期
4 李迎;胡晓凤;侯佳路;;浅谈全文检索系统中文档相关性排序问题[J];电子世界;2012年08期
5 张凯;中文电子出版物的一种检索算法[J];湖北师范学院学报(哲学社会科学版);1999年04期
6 李大农;汉字邻接频率的矩阵表示[J];黄冈师专学报;1997年01期
7 丁承,邵志清;基于字表的中文搜索引擎分词系统的设计与实现[J];计算机工程;2001年02期
8 李培;汉语自动标引方法述评[J];津图学刊;2000年01期
9 彭冬莲;单汉字标引及其检索技术的优化[J];农业图书情报学刊;2005年04期
10 王娟琴;三种检索模型的比较分析研究——布尔、概率、向量空间模型[J];情报科学;1998年03期
中国博士学位论文全文数据库 前1条
1 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
中国硕士学位论文全文数据库 前10条
1 席敏;基于单汉字索引的全文检索系统的研究与实现[D];西安电子科技大学;2010年
2 雷丰云;智能搜索引擎的理论分析与应用研究[D];中南大学;2007年
3 韩开旭;基于查询扩展的油田网络舆情监控系统[D];东北石油大学;2011年
4 许志敏;基于Android的桌面搜索引擎的研究与实现[D];哈尔滨工业大学;2010年
5 崔涛;基于检准率分析中文自动标引方式存在问题及对策[D];河北大学;2011年
6 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
7 司建军;油田信息网信息检索技术研究与应用[D];哈尔滨工程大学;2002年
8 何胜利;矿山法律法规全文检索系统的研究与应用[D];西安建筑科技大学;2005年
9 张敏;生物学文献的自动标引系统的研究与开发[D];东华大学;2006年
10 张维勤;基于SQL Server2000的中文全文检索[D];西安建筑科技大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 杜雪峰;宋家友;;Postgre SQL在GPS车辆监控系统中的应用[J];安徽电子信息职业技术学院学报;2008年06期
2 李季,迟呈英;中文问答系统的研究[J];鞍山科技大学学报;2003年06期
3 岳秋玲;;浅谈机关公文格式中常见的问题及对策[J];办公室业务;2006年03期
4 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
5 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
6 史睿;论中国古籍的数字化与人文学术研究[J];北京图书馆馆刊;1999年02期
7 陈力;中文古籍数字化方法之检讨[J];国家图书馆学刊;2005年03期
8 曹元大,贺海军,涂哲明;中文Web文档全文检索系统的设计及实现[J];北京理工大学学报;2002年01期
9 薛山顺;网络时代的文献检索与后控制词表[J];图书与情报;2000年03期
10 赫荣威,司慧琳;中国法规全文检索系统的开发[J];北京工商大学学报(自然科学版);2001年03期
中国重要会议论文全文数据库 前1条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前4条
1 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
2 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
3 许洪波;大规模信息过滤技术研究及其在Web问答系统中的应用[D];中国科学院研究生院(计算技术研究所);2003年
4 曹玲;农业古籍数字化整理研究[D];南京农业大学;2006年
中国硕士学位论文全文数据库 前10条
1 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
2 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
3 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
4 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
5 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
6 赵鹏;基于数据压缩的信息检索技术的研究[D];黑龙江大学;2002年
7 傅赛香;基于Internet的智能信息检索技术研究[D];广西师范大学;2002年
8 许林杰;中文文本分词研究[D];山东师范大学;2003年
9 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
10 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 贺胜;卢亚军;;面向大规模语料库的全文检索系统研究[J];图书与情报;2008年04期
2 王本欣;高校图书馆Web站点信息检索服务[J];长春师范学院学报;2004年02期
3 蔡兵;胡敏;;基于Lucene2.0的书目搜索引擎设计[J];重庆图情研究;2009年01期
4 张东振;张明;;基于XML的站内检索系统[J];电脑知识与技术;2010年02期
5 李茉莉;基于Web信息检索技术研究[J];大学图书情报学刊;2003年03期
6 杨恒宇;余嵘华;;基于TRIP的全文检索系统的应用及研究[J];电脑知识与技术;2012年25期
7 李雪利;黄理灿;范晨熙;;基于Lucene的文档管理系统的设计与实现[J];工业控制计算机;2012年10期
8 汪涛;;论基于Java的全文检索实现和索引性能提高[J];湖北民族学院学报(自然科学版);2009年01期
9 左伟明;朱永娇;;中文文本检索系统的设计与实现[J];湖南城市学院学报(自然科学版);2011年01期
10 匡振国;倪宏;嵇智辉;刘磊;;一种基于Lucene的影片搜索引擎的研究和应用[J];计算机工程与应用;2008年29期
中国博士学位论文全文数据库 前4条
1 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
2 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
3 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
4 段宇锋;网络链接分析与网站评价研究[D];武汉大学;2004年
中国硕士学位论文全文数据库 前10条
1 余晓菊;Web2.0环境下的研究生个人知识管理研究[D];江西师范大学;2010年
2 梁桢;基于尾字词典的逆向回溯中文分词技术研究[D];武汉工业学院;2010年
3 王红胜;多文档全文检索系统的设计与开发[D];电子科技大学;2010年
4 李海丰;基于Lucene的企业文档搜索引擎研究与应用[D];中南林业科技大学;2009年
5 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
6 穆晓艳;协作网络环境下中学教师非正式学习现状及对策探究[D];华东师范大学;2011年
7 蒋蜀鄂;基于Elgg的个人学习环境的构建与应用研究[D];华中师范大学;2011年
8 李伶;基于3G移动终端的孩童平安信息系统的研究与设计[D];海南大学;2011年
9 肖鹏;基于Android的手机桌面搜索引擎研究与设计[D];电子科技大学;2011年
10 李爱贞;基于Lucene的毕业论文库全文检索系统的设计与实现[D];中国海洋大学;2011年
【二级参考文献】
中国期刊全文数据库 前7条
1 王永成;肖玮瑛;;自动编制中文标题的主题词轮排索引及自动抽词[J];南京大学学报(自然科学版);1984年01期
2 苏新宁;刘晓清;邵品洪;;论中文标题的单字标引与位置检索[J];南京大学学报(自然科学版);1990年02期
3 尚克聪;叙词语言组配方法论评[J];情报学报;1994年04期
4 苏新宁;汉语词切分标引算法的改进[J];情报学报;1996年06期
5 吴蔚天,田鹤卿,丁美珍,胡荣安,霍伯牛;一个汉字科技文献自动标引与检索的实用系统[J];现代图书情报技术;1987年04期
6 苏新宁;中文单字标引算法的改进设想[J];现代图书情报技术;1989年01期
7 王淼;单汉字标引技术的改进研究[J];现代图书情报技术;1997年02期
【相似文献】
中国期刊全文数据库 前10条
1 尹绍宏;用B-树实现倒排文件数据的快速查找[J];天津纺织工学院学报;1999年05期
2 姚全珠;张楠;杨增辉;田元;;基于压缩后缀数组技术的搜索引擎[J];计算机工程;2008年10期
3 刘畅,张辉;一种应用于搜索引擎的索引结构研究[J];计算机与数字工程;2005年09期
4 孟力明,胡铭曾;RDBP—关系数据库处理机的设计与实现[J];小型微型计算机系统;1987年07期
5 张凯;中文电子出版物的一种检索算法[J];湖北师范学院学报(哲学社会科学版);1999年04期
6 熊桂喜;陆壮飞;;专业信息检索系统中索引项提取策略的研究[J];计算机技术与发展;2008年09期
7 欧阳金亮;陆黎明;;基于隐私保护的关联规则挖掘算法[J];计算机与数字工程;2010年08期
8 唐梓荣,刘一鹗;EDBS数据库管理系统[J];计算机工程与应用;1983年Z1期
9 刘源甫;;农业文献计算机检索(续)——第四章 农业文献计算机检索原理[J];农业图书情报学刊;1991年01期
10 张伟,陈芸,邹汉斌,周霆;基于倒排文件的布尔规则隐藏算法[J];计算机工程;2005年14期
中国重要会议论文全文数据库 前10条
1 孙琦;牛军钰;;基于倒排文件的索引模型综述[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 张刚;孙健;丁国栋;米嘉;王斌;;海量数据的索引与检索系统[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
3 辛欣;李涓子;;基于Java语言全文信息检索系统的设计与实现[A];促进企业信息化进程——第十届中国Java技术及应用大会文集[C];2007年
4 周水庚;孙敬宇;胡运发;;一种文档聚类新方法[A];第十六届全国数据库学术会议论文集[C];1999年
5 刘莉;肖诗斌;王涛;施水才;;基于RSS的分布式博客搜索引擎设计[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 董祥千;左志宏;刘强国;;Lucene倒排索引文件的实现与优化[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
7 王洪俊;施水才;俞士汶;肖诗斌;;人民日报标注语料的索引方法研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 田生伟;吐尔根·依布拉音;禹龙;买合木提·木合买提;艾山·吾买尔;;EBMT中加权的维吾尔单词哈希表构造算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 骆吉洲;李建中;高宏;;频率向量的一种压缩存储方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
10 张谊岩;张霞;;OpenBASE中BLOB型文本数据全文检索的设计与实现[A];第十六届全国数据库学术会议论文集[C];1999年
中国硕士学位论文全文数据库 前10条
1 李帅;全文检索在“2008奥运多语言系统”中的应用研究与实现[D];北京工业大学;2009年
2 程传鹏;基于分类的智能信息检索研究与实现[D];云南师范大学;2005年
3 杨胜天;生物医学信号无损/近无损压缩技术的研究[D];浙江大学;2002年
4 王齐;一种基于文本节点的XML文档索引和查询方法[D];山西大学;2005年
5 王远定;中文搜索引擎的快速检索方法研究[D];江南大学;2009年
6 席敏;基于单汉字索引的全文检索系统的研究与实现[D];西安电子科技大学;2010年
7 李玥;基于Web文档理解的倒排全文索引研究与实现[D];江西理工大学;2010年
8 接凤华;关联规则及数据的隐私保护算法研究[D];东南大学;2006年
9 薛静;中文信息检索中相关算法的研究[D];辽宁科技大学;2007年
10 荣慧媛;基于语义的Web信息查询技术的研究[D];哈尔滨工程大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026