收藏本站
《计算机应用研究》 2007年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

主题网络爬虫研究综述

刘金红  陆余良  
【摘要】:首先给出了主题网络爬虫的定义和研究目标;然后系统分析了近年来国内外主题爬虫的研究方法和技术,包括基于文字内容的方法、基于超链分析的方法、基于分类器预测的方法以及其他主题爬行方法,并比较了各种方法优缺点;最后对未来的研究方向进行了展望。
【作者单位】解放军电子工程学院网络系 解放军电子工程学院网络系
【分类号】:TP391.3

【引证文献】
中国硕士学位论文全文数据库 前2条
1 王磊;公安网络舆情分析系统的研究[D];北京交通大学;2008年
2 杨梅;网络舆情热点发现的研究[D];北京交通大学;2008年
【参考文献】
中国期刊全文数据库 前2条
1 李卫;刘建毅;何华灿;王枞;;基于主题的智能Web信息采集系统的研究与实现[J];计算机应用研究;2006年02期
2 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期
【共引文献】
中国期刊全文数据库 前3条
1 赵佳鹤;王秀坤;刘亚欣;;基于语义分析的主题信息采集系统的设计与实现[J];计算机应用;2007年02期
2 傅向华;冯博琴;;一种支持复杂查询的有组织P2P搜索方法[J];小型微型计算机系统;2006年03期
3 傅向华;冯博琴;;主题驱动的P2P分布式信息搜索机制研究[J];小型微型计算机系统;2006年04期
中国博士学位论文全文数据库 前1条
1 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
中国硕士学位论文全文数据库 前9条
1 吴东华;Web信息获取技术研究[D];南京理工大学;2004年
2 寿周翔;专业搜索引擎的研究与设计[D];浙江大学;2005年
3 马骊;基于搜索引擎技术的警情信息搜集系统的研究与实现[D];山东大学;2006年
4 赵佳鹤;基于语义分析的网络信息采集算法研究与应用[D];大连理工大学;2006年
5 刘洁清;网站聚焦爬虫研究[D];江西财经大学;2006年
6 孙雷;面向特定领域的智能搜索技术研究[D];哈尔滨工程大学;2007年
7 魏霞;面向网络教育的学习评价依据采集系统的研究与实现[D];浙江工业大学;2007年
8 谢德辉;面向刑侦网页的信息抽取与主题爬虫应用研究[D];大连理工大学;2007年
9 许琦;个性化信息服务技术研究[D];浙江大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 罗欣,夏德麟,晏蒲柳;基于词频差异的特征选取及改进的TF-IDF公式[J];计算机应用;2005年09期
2 肖美华,薛锦云;遗传算法机理的研究及应用[J];计算机工程;2003年20期
3 吴斌,史忠植;一种基于蚁群算法的TSP问题分段求解算法[J];计算机学报;2001年12期
4 闫友彪,陈元琰;机器学习的主要策略综述[J];计算机应用研究;2004年07期
5 王灏,黄厚宽,田盛丰;文本分类实现技术[J];广西师范大学学报(自然科学版);2003年01期
6 赫枫龄,左万利;用有向图法解决网页爬行中循环链接问题[J];吉林大学学报(理学版);2004年03期
7 郑丽桑;兰樟仁;卢毅敏;;福建省林业信息服务平台的研究[J];集美大学学报(自然科学版);2006年02期
8 吴明礼,施水才;一种结合超链接分析的搜索引擎排序方法[J];计算机工程;2004年15期
9 程宝栋;宋维明;;中国木材产业资源基础及可持续性分析[J];林业资源管理;2006年01期
10 谭宇红,胡德华,柳晓春;中文搜索引擎分类体系研究[J];情报科学;2001年06期
中国重要会议论文全文数据库 前1条
1 朴星海;赵铁军;郑德权;张迪;;面向Blog的网络爬行器设计与实现[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 杨剑峰;蚁群算法及其应用研究[D];浙江大学;2007年
2 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
3 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
4 范昕炜;支持向量机算法的研究及其应用[D];浙江大学;2003年
5 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
6 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
7 窦郁宏;程序挖掘中构件描述和检索的研究[D];中南大学;2002年
8 董道国;高维数据索引结构研究[D];复旦大学;2005年
9 余轶军;Web访问信息挖掘若干关键技术的研究[D];浙江大学;2006年
10 吴丽辉;个性化的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 刘强国;主题搜索引擎设计与研究[D];电子科技大学;2007年
2 叶勤勇;基于URL规则的聚焦爬虫及其应用[D];浙江大学;2007年
3 郑火国;农业信息服务平台的构建与实现[D];中国农业科学院;2006年
4 刘洁清;网站聚焦爬虫研究[D];江西财经大学;2006年
5 栾丽华;聚类算法研究[D];南京师范大学;2004年
6 刘壁松;策略可扩展的搜索引擎研究和实现[D];清华大学;2005年
7 张晓峰;并行网页抓取系统设计[D];北京交通大学;2007年
8 薛惠忠;WEB信息的抽取与集成[D];东南大学;2004年
9 史军强;WEB信息集成技术研究[D];电子科技大学;2005年
10 贺智平;Web信息自动抽取技术研究[D];西安电子科技大学;2006年
【二级参考文献】
中国期刊全文数据库 前3条
1 苏伟峰,李绍滋,李堂秋;一个基于概念的中文文本分类模型[J];计算机工程与应用;2002年06期
2 代六玲,黄河燕,陈肇雄;中文文本分类中特征抽取方法的比较研究[J];中文信息学报;2004年01期
3 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
【相似文献】
中国期刊全文数据库 前10条
1 叶鹰,马景娣,黄晨,朱聪,胡晓珍,刘琼;信息检索网上自助教学探索[J];大学图书馆学报;2000年02期
2 赖俊;周琳;张学平;;基于Web挖掘的主题式搜索引擎的设计[J];军事通信技术;2004年03期
3 彭波,闫宏飞;搜索引擎检索系统质量评估[J];计算机研究与发展;2005年10期
4 王国金,康耀红;基于布尔检索策略的问答系统性能研究[J];科技广场;2005年10期
5 李雷;;常用医学搜索引擎简介[J];西北医学教育;2005年05期
6 张选平;蒋宇;袁明轩;马琮;梁平;;一种基于概念的信息检索查询扩展[J];微电子学与计算机;2006年04期
7 刘策;;垂直搜索——电子商务领域的新秀[J];软件导刊;2006年11期
8 吴红;;网上免费农业信息资源的检索挖掘策略[J];农业网络信息;2006年09期
9 唐利;蓝强;;对网络搜索引擎的比较研究[J];重庆文理学院学报(自然科学版);2006年04期
10 韩建福;卢苇;;文档聚类在Web搜索结果中的应用研究[J];中国科技信息;2006年23期
中国重要会议论文全文数据库 前10条
1 ;编者的话[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 米晓红;;一种基于LSI的用户兴趣模型构建方法[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
3 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
4 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 田田;马军;李跃军;;应用多本体进行信息检索的研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 吴立德;黄萱菁;;前言[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 吴晓;李丹宁;林洁;冀肖榆;李丹;;个性化搜索引擎中用户兴趣模型的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 秦鹏;李恒训;张华平;刘金刚;;基于关键词提取的搜索结果聚类研究[A];第五届全国信息检索学术会议论文集[C];2009年
9 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
10 文健;李舟军;;基于聚类语言模型的生物文献检索技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 希安;微软试水信息检索[N];经济日报;2004年
2 本报记者 潘永花;组件化平台提升信息检索效率[N];网络世界;2003年
3 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
4 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
5 于振海;Microsoft Office 2003的翻译服务你用了吗?[N];中国电脑教育报;2004年
6 高丽华;信息化遭遇新雷区[N];计算机世界;2007年
7 李茂 编译;创新是技术素养的第一要求[N];中国教师报;2007年
8 西安 张树忠 时剑;如何使用Word 2003翻译功能[N];电子报;2004年
9 涂序彦 陈泓娟;在网络信息海洋中淘金[N];计算机世界;2001年
10 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 左家莉;信息检索中Markov网络图模型研究[D];江西财经大学;2011年
2 吴定峰;基于本体的语义搜索模型研究[D];中国农业科学院;2012年
3 董道国;高维数据索引结构研究[D];复旦大学;2005年
4 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
5 林建方;词搭配抽取及在信息检索中的应用研究[D];哈尔滨工业大学;2010年
6 郭永明;XML文档交互式信息检索技术研究[D];东华大学;2010年
7 林古立;互联网信息检索中的多样化排序研究及应用[D];华南理工大学;2011年
8 马马杜 桑卡雷;基于多智能体的流体动力行业虚拟联盟信息检索的研究[D];浙江大学;2002年
9 刘云峰;基于潜在语义分析的中文概念检索研究[D];华中科技大学;2005年
10 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
中国硕士学位论文全文数据库 前10条
1 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
2 杨才峰;基于自动分类的元搜索引擎的研究与应用[D];华北电力大学(河北);2005年
3 宋海林;基于语言模型的信息检索中负反馈技术的研究与实现[D];内蒙古大学;2011年
4 杭月芹;基于文档查询信息的检索系统研究与实现[D];扬州大学;2005年
5 史锦荣;基于多Agent智能搜索引擎模型研究[D];太原理工大学;2005年
6 吴媛媛;移动终端上个人信息检索核心子系统的设计与实现[D];北京邮电大学;2011年
7 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
8 曹双喜;研究生在CNKI数字图书馆信息检索过程中的选择行为研究[D];西南大学;2006年
9 马志柔;中文信息检索分类技术的研究[D];北京化工大学;2005年
10 袁晓丰;列表类自动问题问答系统的设计与实现[D];复旦大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026