收藏本站
《计算机工程》 2000年S1期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

搜索引擎中的信息存储技术

宋聚平  王永成  
【摘要】:网络已经成为世界上最大的数字图书馆,目前网上信息数量仍在急剧膨胀,无用信息占有比例愈来愈大,而且网络传输速度较慢,由于网页的存储结构直接影响着查询质量和查询速度,因此网络信息的存储方式亟需改进。本文针对网络信息固有的特点提出一种新的文档存储结构,改进了搜索引擎的性能.其中主要包括信息的自动分类,网页相关度的计算,垃圾信息以及重复信息的过滤等技术。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
【共引文献】
中国期刊全文数据库 前10条
1 李业丽,陆利坤;数据挖掘在虚拟企业联盟中的应用研究[J];北京印刷学院学报;2004年01期
2 高文杰,刘素兰;一种基于WWW的INTERNET信息开采系统[J];电脑与信息技术;2000年03期
3 陈文;浅谈网络信息建设过程[J];大学图书情报学刊;2001年02期
4 韩惠琴,刘柏嵩,董其军;知识发现在数字图书馆中的应用[J];大学图书馆学报;2001年01期
5 邓丽,吴扬扬;挖掘Web数据[J];福建电脑;2003年08期
6 张脂平,林世平;Web文本挖掘中特征提取算法的分析及改进[J];福州大学学报(自然科学版);2004年S1期
7 张海强,张永;网络用法挖掘及其应用[J];兰州理工大学学报;2004年05期
8 唐懿芳 ,牛力 ,傅赛香 ,严小卫;文本的自动分类[J];广西师范大学学报(自然科学版);2001年04期
9 孙志东;潘懋;孙知信;闫秋艳;;轻量级自适应搜索引擎的设计与实现[J];广西师范大学学报(自然科学版);2007年02期
10 卢小华;WWW信息挖掘技术及其在水利水电领域中的应用[J];湖北水力发电;2003年01期
中国重要会议论文全文数据库 前6条
1 胥永康;岳筱玲;;浅谈网络信息挖掘应用技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 黎琳;;Web内容挖掘在数字图书馆中的应用[A];中国工程物理研究院第七届电子技术青年学术交流会论文集[C];2005年
3 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 陶兰;李四明;冯爽;;面向领域的网上信息挖掘系统研究与实现[A];第六届全国计算机应用联合学术会议论文集[C];2002年
5 鄢丹;刘杰;李洁;;基于信息技术的食源性疾病防范体系[A];2004年生命系统建模仿真国际会议暨第一届全国生命系统建模仿真学术会议论文集[C];2004年
6 李振星;徐泽平;;基于兴趣模型的WEB信息预测采集过滤方法[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
2 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
3 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
4 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
5 俞方桦;互联网信息资源整合研究[D];东华大学;2001年
6 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
7 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
8 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
9 傅明;基于Web的空间数据挖掘研究[D];中南大学;2004年
10 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
中国硕士学位论文全文数据库 前10条
1 高顺纪;基于Agent的中文多元搜索引擎的研究和开发[D];北京工业大学;2000年
2 陈小宁;Web信息资源获取技术的研究与实现[D];暨南大学;2001年
3 杜民;应用神经网络的Internet智能代理的实现[D];暨南大学;2001年
4 邓英;数据仓库与数据挖掘技术理论及应用的研究[D];甘肃工业大学;2001年
5 翟蕾;Web文档分类及信息抽取的研究与开发[D];西北工业大学;2001年
6 黄炳骜;动态PUSH系统原型的设计[D];西南师范大学;2001年
7 吴思;聚类分析及其在农业物种信息自动提取中的应用[D];湘潭大学;2001年
8 薛鹏军;基于知识库的中文网络检索工具——经济信息智能搜索引擎研究[D];南京农业大学;2001年
9 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
10 钱小军;Web文本挖掘技术研究及其实现[D];浙江大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 武旭,须德;基于向量空间模型的文本自动分类系统的研究与实现[J];北方交通大学学报;2003年02期
2 凌美秀;关于搜索引擎当前存在的主要问题及其发展趋势的探讨[J];高校图书馆工作;2001年05期
3 陈康,许婷,戴文俊,武港山;基于Web的全文搜索引擎的设计与实现[J];计算机工程;2005年20期
4 蒋凯;武港山;;基于Web的信息检索技术综述[J];计算机工程;2005年24期
5 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
6 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
7 凤元杰,刘正春,王坚毅;搜索引擎主要性能评价指标体系研究[J];情报学报;2004年01期
8 常璐,夏祖奇;搜索引擎的几种常用排序算法[J];图书情报工作;2003年06期
9 郑腾锐,范智军;网络搜索引擎的现状与使用[J];现代情报;2003年02期
10 姚艳玲;www网络信息资源检索工具——搜索引擎[J];现代情报;2003年09期
中国硕士学位论文全文数据库 前2条
1 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
2 应亦丰;Web搜索引擎原理与实现[D];浙江大学;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 张晓辉,邵华,常桂然;WWW上的信息发现与搜索引擎技术[J];小型微型计算机系统;1998年06期
【相似文献】
中国期刊全文数据库 前10条
1 秦倩;谢宝娣;顾兆军;王超;黄宇宫;;网络数据包还原和内容分析系统的设计与实现[J];中国民航大学学报;2011年03期
2 张冬梅;王磊;;面向分布式网络的信息按需分层分发系统框架[J];自动化仪表;2011年08期
3 代文征;;Web用户兴趣模型研究[J];软件导刊(教育技术);2011年06期
4 熊钰君;崔家铭;;基于web2.0的知识共享研究综述[J];东方企业文化;2011年02期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 毛颖;周源远;王继成;;信息过滤技术研究[A];第一届学生计算语言学研讨会论文集[C];2002年
2 白硕;程学旗;郭莉;王斌;余智华;刘群;;大规模内容计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 王岩;;基于内容的垃圾邮件过滤技术[A];中国通信学会第六届学术年会论文集(中)[C];2009年
4 胡熠;郑德权;赵铁军;于浩;王青松;;WWW页面信息中特定内容的过滤研究[A];第一届学生计算语言学研讨会论文集[C];2002年
5 潘文锋;王斌;于满泉;谭松波;;Winnow算法在垃圾邮件过滤中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
6 陈儒;张宇;刘挺;;面向网络实时数据流的中文信息多模式模糊匹配[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
7 邓蔚;秦志光;;基于Kolmogorov复杂性的垃圾信息过滤研究综述[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
8 曹雷;杜辉锋;;基于Web挖掘的个性化推荐模型的研究[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
9 刘林;刘臻;;基于知识的网上监控系统的研究[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
10 刘金红;陆余良;;一种基于Ontology的网络信息过滤方法研究[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
中国重要报纸全文数据库 前10条
1 卢东祥;校园网防火墙的选购[N];中国电脑教育报;2003年
2 王萍;Web文本的知识化管理[N];计算机世界;2006年
3 yzscholar;放心从这里开始[N];中国电脑教育报;2002年
4 巧巧;QQ病毒的克星[N];电脑报;2003年
5 刘;不该进的都别想进[N];中国计算机报;2004年
6 ;赛尔网络教育城域网解决方案[N];中国计算机报;2003年
7 张贵朋;网康科技:把互联网弊端“关”在门外[N];通信产业报;2006年
8 邓侃;防火墙——企业安全第一关[N];中国计算机报;2002年
9 ;国产软件下载TOP10[N];中国电脑教育报;2004年
10 刘;防病毒、防垃圾邮件 两不误[N];中国计算机报;2004年
中国博士学位论文全文数据库 前1条
1 何军;Internet中多媒体信息过滤技术的研究[D];电子科技大学;2002年
中国硕士学位论文全文数据库 前10条
1 曲建华;Web上的信息过滤问题研究[D];山东师范大学;2003年
2 陈红莲;面向互联网的信息过滤技术研究[D];浙江大学;2003年
3 许明英;反馈增量学习算法及其在网络信息过滤中的应用研究[D];山东师范大学;2012年
4 赵海雁;基于数据链路层数据捕获与信息过滤[D];华北工学院;2004年
5 周威成;信息过滤方法的研究与应用[D];华北电力大学(北京);2003年
6 吴福英;面向用户的信息过滤研究与实现[D];江西师范大学;2004年
7 管玉娟;基于智能Agent的个性化信息检索技术研究[D];西安建筑科技大学;2005年
8 代学武;基于神经网络的用户建模和Web信息过滤研究[D];西南师范大学;2003年
9 马晓兰;网页内容分级过滤系统研究[D];华东师范大学;2004年
10 高凌云;基于移动代理的信息发布和检索框架的设计与实现[D];东北大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026