收藏本站
《北京理工大学学报》 2004年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于概念分析的主题爬虫设计

汪涛  樊孝忠  顾益军  刘林  
【摘要】:研究改进主题爬虫设计的方法,用高效的主题爬虫取代传统搜索引擎中的普通爬虫,以更高的精度完成定向信息采集.在成功实现基于关键词的主题爬虫的基础上,提出了基于概念的主题相关度分析算法,给出了基于概念分析的主题爬虫的实现方案.比较两种主题爬虫工作的实验结果,显示爬虫的性能得到了提高,论证了该设计的可行性与可操作性,为实现准确的定向信息采集奠定了良好的基础.

【引证文献】
中国期刊全文数据库 前1条
1 汪涛,樊孝忠;链接分析对主题爬虫的改进[J];计算机应用;2004年S2期
中国硕士学位论文全文数据库 前5条
1 李文泽;个性化垂直搜索引擎研究[D];河南大学;2007年
2 熊化宇;网络信息组织的质量控制研究[D];湘潭大学;2005年
3 蒋科;基于领域概念定制的主题爬虫系统的设计与实现[D];西安电子科技大学;2007年
4 周旭;BBS热点分析系统研究[D];北京交通大学;2007年
5 韩磊;新闻预定服务系统[D];山东大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 张雪燕;杨晟刚;;PageRank技术在智能系统中的应用[J];现代计算机;2006年09期
2 徐金雷;杨晓江;;基础教育资源搜索引擎的排序算法研究[J];电化教育研究;2007年02期
3 唐培和,杨新伦,刘浩;Google搜索引擎及其实现技术[J];广西工学院学报;2004年02期
4 刘林,汪涛,樊孝忠;主题爬虫的解决方案[J];华南理工大学学报(自然科学版);2004年S1期
5 杨海东,张莉;PageRank技术分析与搜索引擎检索效率研究[J];淮阴师范学院学报(自然科学版);2003年03期
6 杨沅钊,吴薇,喻晓莉,杨国才;搜索引擎排名改进算法分析[J];农业网络信息;2005年02期
7 汪涛,樊孝忠;主题爬虫的设计与实现[J];计算机应用;2004年S1期
8 汪涛,樊孝忠;链接分析对主题爬虫的改进[J];计算机应用;2004年S2期
9 陈再良;凌力;周强;;dPageRank——一种改进的分布式PageRank算法[J];计算机应用;2006年01期
10 葛蓉;利用网络日志分析提高搜索引擎的检准率[J];情报科学;2004年10期
中国重要会议论文全文数据库 前1条
1 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前2条
1 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
2 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
中国硕士学位论文全文数据库 前10条
1 郝金隆;网络原创文章优先的搜索引擎排序算法研究[D];重庆大学;2007年
2 黄治国;基于粗糙集的信息检索研究[D];中南大学;2007年
3 朱素媛;网络教育中的智能搜索引擎的研究[D];合肥工业大学;2004年
4 谭德坤;文本挖掘及其在UDDI Registry智能检索中的应用[D];昆明理工大学;2004年
5 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
6 陆勇;面向信息检索的汉语同义词自动识别[D];南京农业大学;2005年
7 张玲莉;使用二维可视化技术的网站可用性分析方法的研究与应用[D];大连海事大学;2005年
8 张波;个性化Web搜索系统研究[D];燕山大学;2006年
9 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年
10 陈斌;中国现代化支付系统模式分析的关键技术研究[D];上海交通大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 沈丹莹;;Web信息智能过滤系统WIIFS的研究[J];福建电脑;2006年01期
2 王德峰;李东;;搜索引擎Google的体系结构及其核心技术研究[J];哈尔滨商业大学学报(自然科学版);2006年01期
3 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
4 康平波,王文杰;基于自动分类的搜索引擎过滤系统[J];计算机工程;2004年02期
5 尹春天,古志民,廖祥文;基于搜索结果的预取技术研究[J];计算机应用;2004年01期
6 陈再良;凌力;周强;;dPageRank——一种改进的分布式PageRank算法[J];计算机应用;2006年01期
7 刘遵雄;搜索引擎的智能化发展趋势[J];科技情报开发与经济;2004年06期
8 胡蓉,周经野;搜索引擎的发展与个性化技术研究[J];宁波职业技术学院学报;2005年02期
9 焦玉英,刘伟成,孙吉红;基于向量空间模型的专题文献过滤算法研究[J];情报学报;2005年05期
10 张亮;黄河燕;王树梅;;面向汉语分析的搜索引擎研究与实现[J];情报学报;2006年04期
中国重要会议论文全文数据库 前1条
1 李盛韬;吴丽辉;于满泉;潘文锋;余智华;王斌;程学旗;;主题Web信息采集的研究与设计[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前1条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
【二级引证文献】
中国硕士学位论文全文数据库 前2条
1 王秋玲;基于RDF的Web资源管理关键技术研究与应用[D];解放军信息工程大学;2006年
2 朱玉丽;基于网格技术的主题爬虫算法优化的研究与实现[D];沈阳工业大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 向维稻;科研技术路线的“弱支拓新效应”分析[J];软科学;1996年01期
2 Christopher Null ,李琳;interMute 1.3——再见了,闪烁的标题[J];电子与电脑;1999年07期
3 闫磊;网上一小时 问题一大筐[J];网络与信息;1999年10期
4 ;当蝴蝶不再飞翔[J];电脑爱好者;1999年07期
5 闫磊;网上一小时 问题一大筐[J];计算机周刊;2000年17期
6 云起;卡兹的悲剧[J];计算机周刊;2000年20期
7 西北;网络游戏[J];电脑爱好者;2000年17期
8 ;科技新讯[J];今日科技;2001年01期
9 英集;新词集锦[J];计算机与农业;2002年03期
10 陈韶斌,丁明跃,周成平;WWW上的图像搜索引擎系统SeekImg[J];计算机与数字工程;2002年02期
中国重要会议论文全文数据库 前4条
1 郑林森;;苏东坡与九龙文化[A];2002中国未来与发展研究报告[C];2002年
2 任进兴;朱志斌;;日本球坚蚧的发生规律与周年综合防治历[A];当代昆虫学研究——中国昆虫学会成立60周年纪念大会暨学术讨论会论文集[C];2004年
3 王珏;卢艳平;张泽宏;邹永宁;;一种有记忆的变窗“爬虫”图像边界跟踪方法[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
4 梁循;杨健;陈华;曾月卿;;互联网金融信息搜索[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 张蕊;走出搜索引擎认识上的误区[N];中国计算机报;2000年
2 易水;计算机专业时文选读(799)[N];计算机世界;2000年
3 蒲昭和;九香虫营养价值高[N];人民政协报;2000年
4 伟山;一种低毒高效农药[N];云南经济日报;2000年
5 李学江;动物伤人漫议[N];人民日报;2001年
6 安武林;女人最好的化妆品[N];中国图书商报;2001年
7 陈鹤琴;不要恐吓哄骗打骂孩子[N];中国教育资讯报;2002年
8 新华社记者 张周来;坐在家里逛故宫[N];新华每日电讯;2002年
9 [美]尼考尔·怀斯文;欢迎小朋友光临的房子[N];中国教师报;2003年
10 上海 朱立强;你的网络情报员——X-Info[N];电脑报;2003年
中国硕士学位论文全文数据库 前4条
1 杨静;基于MSEA及不变矩的图象目标识别算法研究[D];中国科学院西安光学精密机械研究所;2001年
2 蔡霞;基于自然语言理解的个性化Web 数据挖掘系统的设计及实现方法研究[D];浙江工业大学;2003年
3 王毅;皮革图象分割及处理[D];西北工业大学;2004年
4 顾凯;中文视频搜索的构筑与实践[D];北京邮电大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026