收藏本站
《计算机应用》 2004年S1期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

主题爬虫的设计与实现

汪涛  樊孝忠  
【摘要】:文章以主题相关度为核心研究了设计主题爬虫的相关技术 ,通过实验给出了具体实现。实验结果充分论证了其可行性与实用性 ,为进行主题搜索引擎设计和主题信息采集奠定了良好的基础。

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 邱均平,张洋;网络信息计量学综述[J];高校图书馆工作;2005年01期
2 汪涛,樊孝忠;链接分析对主题爬虫的改进[J];计算机应用;2004年S2期
3 刘洁清;吴京慧;;面向主题的个人实时搜索引擎的设计与实现[J];现代图书情报技术;2006年05期
4 姜杰,杨晓江;专业搜索引擎分布式Robot的设计研究[J];中国电化教育;2005年06期
中国硕士学位论文全文数据库 前10条
1 肖亮;垂直搜索引擎的研究与实现[D];北京交通大学;2008年
2 刘强国;主题搜索引擎设计与研究[D];电子科技大学;2007年
3 王晓华;基于内容的搜索引擎技术研究及其应用[D];郑州大学;2005年
4 姜杰;专业搜索引擎分布式Robot设计研究[D];南京师范大学;2005年
5 叶昭晖;网络信息雷达系统的研究与设计[D];国防科学技术大学;2005年
6 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年
7 刘洁清;网站聚焦爬虫研究[D];江西财经大学;2006年
8 姜鑫维;基于分布式的智能搜索引擎[D];武汉理工大学;2006年
9 赵钦;并行爬行器的架构与优化策略[D];北京工业大学;2006年
10 韩磊;新闻预定服务系统[D];山东大学;2007年
【参考文献】
中国重要会议论文全文数据库 前1条
1 李盛韬;吴丽辉;于满泉;潘文锋;余智华;王斌;程学旗;;主题Web信息采集的研究与设计[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【共引文献】
中国期刊全文数据库 前10条
1 张雪燕;杨晟刚;;PageRank技术在智能系统中的应用[J];现代计算机;2006年09期
2 王树西;白硕;;事实库、规则库的一体化全文索引算法[J];计算机科学;2006年04期
3 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
4 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
5 徐金雷;杨晓江;;基础教育资源搜索引擎的排序算法研究[J];电化教育研究;2007年02期
6 唐培和,杨新伦,刘浩;Google搜索引擎及其实现技术[J];广西工学院学报;2004年02期
7 莫丽萍,王树西,姜吉发,雷雨霞;问答系统和浅层结构模式推理[J];广西师范大学学报(自然科学版);2004年01期
8 张红斌;;网上求职机器人的软件设计[J];华东交通大学学报;2006年01期
9 刘林,汪涛,樊孝忠;主题爬虫的解决方案[J];华南理工大学学报(自然科学版);2004年S1期
10 杨海东,张莉;PageRank技术分析与搜索引擎检索效率研究[J];淮阴师范学院学报(自然科学版);2003年03期
中国重要会议论文全文数据库 前5条
1 郑泽之;;中文自动分词的一些问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 石子夜;;置信分词——面向中分信息检索的分词模式[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
4 吴春胤;陈联诚;俞守华;;基于AgMES的搜索引擎的设计与实现[A];农业工程科技创新与建设现代农业——2005年中国农业工程学会学术年会论文集第三分册[C];2005年
5 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前7条
1 叶作亮;基于制造网格的制造资源管理若干关键技术研究[D];浙江大学;2006年
2 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
3 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
4 常春;Ontology在农业信息管理中的构建和转化[D];中国农业科学院;2004年
5 代六玲;互联网内容监管系统关键技术的研究[D];南京理工大学;2005年
6 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
7 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
中国硕士学位论文全文数据库 前10条
1 刘加发;EBM网络搜索引擎的研究与实现[D];大连海事大学;2008年
2 邹庆欣;基于Agent专业搜索引擎的研究[D];大连海事大学;2008年
3 郭勇胜;搜索引擎基于网格技术的应用[D];大连理工大学;2007年
4 许琦;个性化信息服务技术研究[D];浙江大学;2007年
5 任严;基于网络视频业务的搜索引擎的设计与实现[D];北京交通大学;2008年
6 郝金隆;网络原创文章优先的搜索引擎排序算法研究[D];重庆大学;2007年
7 曹淑英;个性化自动文摘的研究与实现[D];中国石油大学;2007年
8 卢耀素;GIS可视化互联网新闻搜索引擎的研究与实现[D];华中科技大学;2006年
9 姜胜辉;基于Web的超硬刀具综合信息检索系统[D];哈尔滨理工大学;2007年
10 郭鹏;汉语语法语料库系统的基础设计[D];天津师范大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 肖冬梅;垂直搜索引擎研究[J];图书馆学研究;2003年02期
2 罗丽姗;;垂直搜索引擎发展概述[J];图书馆学研究;2006年12期
3 唐培丽,胡明,张勇;基于中文文本主题提取的分词方法研究[J];吉林工程技术师范学院学报;2005年02期
4 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期
5 韩毅;;P2P网络信息检索的研究进展[J];现代图书情报技术;2007年07期
6 林亚平,李彦,童调生,尹锋;汉语自动分词中的神经网络技术研究[J];湖南大学学报(自然科学版);1997年06期
7 张晓冬,张书杰,邢俊丽,李俊玉;关于信息过滤模型的探讨[J];计算机工程与应用;2002年05期
8 姚砺,束永安;用JavaCC构造编译器的方法[J];计算机工程;2003年09期
9 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
10 王强 ,王继成 ,武港山 ,张福炎;Web文档清洗系统中HTML解析器的开发[J];计算机应用研究;2002年02期
中国重要会议论文全文数据库 前1条
1 李盛韬;吴丽辉;于满泉;潘文锋;余智华;王斌;程学旗;;主题Web信息采集的研究与设计[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前1条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
中国硕士学位论文全文数据库 前10条
1 刘峰;通用中英文专业搜索引擎技术的研究及应用[D];大连理工大学;2004年
2 王术;面向个性化服务的网页特征描述方法研究[D];重庆大学;2004年
3 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
4 张校乾;基于Lucene的全文检索系统的研究与应用[D];大连理工大学;2005年
5 王亮;搜索引擎及其相关性排序研究[D];武汉大学;2004年
6 何华;搜索引擎中的数据存储问题研究[D];浙江大学;2005年
7 刘妮娜;Web数据挖掘和个性化搜索引擎研究[D];浙江大学;2005年
8 曹红;林业主题搜索引擎研究[D];北京林业大学;2005年
9 杨慧;个性化网络信息检索系统的研究和应用[D];南京工业大学;2005年
10 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年
【二级引证文献】
中国期刊全文数据库 前3条
1 郑文晖;;文献计量法与内容分析法的比较研究[J];情报杂志;2006年05期
2 牛春华;沙勇忠;;Web空间内部链接特征的聚类分析[J];图书情报知识;2006年06期
3 杨晓江;李丽娟;田俊华;李艺;;面向基础教育的Web资源垂直服务体系研究[J];中国远程教育;2006年07期
中国硕士学位论文全文数据库 前10条
1 潘浩;网络计量学实证研究[D];天津师范大学;2007年
2 陈雪;基于路径的引文分析模型研究[D];西南大学;2007年
3 李文泽;个性化垂直搜索引擎研究[D];河南大学;2007年
4 何世林;基于Java技术的搜索引擎研究与实现[D];西南交通大学;2006年
5 王星辉;搜索引擎设计分析与查询改进[D];电子科技大学;2007年
6 胡晓博;面向特定领域的专业搜索引擎的架构与实现方法[D];哈尔滨工程大学;2007年
7 廖继东;基于DotLucene网站全文搜索系统的实现[D];郑州大学;2007年
8 郑莉霞;基于文本的Web图像检索技术研究[D];广西大学;2007年
9 陈小峰;专业搜索引擎的数据存储研究[D];南京师范大学;2007年
10 欧阳霞;网络信息计量学方法论研究[D];兰州大学;2006年
【二级参考文献】
中国期刊全文数据库 前4条
1 张义忠,赵明生,朱精南;基于内容的网页特征提取[J];计算机工程与应用;2001年10期
2 陈新明,钟涛,万钧,吴杰,张世永;WWW搜索引擎的数据采集技术[J];计算机工程与应用;2002年07期
3 高大庆,蒙应杰,杜义涛,赵书城;基于复用技术的分布式Web软件开发方法的研究[J];计算机工程与应用;2002年12期
4 赵书城,蒙应杰,马建国,陆为国;敦煌学Web数据库的设计与实现[J];计算机应用研究;2002年01期
【相似文献】
中国期刊全文数据库 前10条
1 马亮,陈群秀,王俊,徐国伟;智能Web中文主题信息收集系统IRobot的设计[J];中文信息学报;2002年05期
2 杨沛;郑启伦;彭宏;;Web主题关联知识自学习算法[J];计算机科学;2003年10期
3 骆卫华,罗振声,宫小瑾;中文文本自动校对技术的研究[J];计算机研究与发展;2004年01期
4 杨沛,郑启伦,彭宏;Inherit/Feedback:一种新的Web主题挖掘方法[J];计算机研究与发展;2004年05期
5 汪涛,樊孝忠;主题爬虫的设计与实现[J];计算机应用;2004年S1期
6 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
7 汪涛,樊孝忠;链接分析对主题爬虫的改进[J];计算机应用;2004年S2期
8 聂应高;EBSCO和Springer Link外文期刊数据库比较研究[J];晋图学刊;2005年01期
9 刘红,邵晓良,胡吉兵;基于页面内容和链接结构的超链接主题预测算法[J];现代图书情报技术;2005年05期
10 张娜;张化祥;;基于超链接和内容相关度的检索算法[J];计算机应用;2006年05期
中国硕士学位论文全文数据库 前1条
1 韩亚洪;结合内容与链接分析搜索特定主题的权威Web信息源[D];河海大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026