收藏本站
《上海交通大学学报》 2003年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

对网页PageRank算法的改进

宋聚平  王永成  尹中航  滕伟  
【摘要】:分析了著名搜索引擎 Google采用的 Page Rank算法 ,指出其偏重旧网页、忽视专业站点以及对网页中的超链接评估不恰当等不足之处 .改进算法考虑了网页日期这一重要因素 ,并重新计算网页中超链接对网页的影响 .网页结构中蕴涵着丰富的信息 ,在 href、title等标记中文字对网页主题有重要作用 ,利用结构标记可以辅助判断网页的主题内容 .试验结果表明 ,采用改进的算法可以提高判断网页重要性的准确度

【引证文献】
中国期刊全文数据库 前10条
1 黎孟雄;;基于移动Agent的教学资源智能采集系统的研究[J];长春大学学报;2010年12期
2 高灵霞;;基于主题爬虫的个性化搜索引擎技术分析[J];电脑知识与技术;2009年32期
3 王向阳;马军;;一个基于PageRank的科技文献质量评价算法[J];广西师范大学学报(自然科学版);2009年01期
4 何明;周军;李树友;;语义相似的PageRank改进算法[J];计算机工程与应用;2009年27期
5 黄德才;戚华春;;PageRank算法研究[J];计算机工程;2006年04期
6 杨劲松;凌培亮;;搜索引擎PageRank算法的改进[J];计算机工程;2009年22期
7 杨沅钊,吴薇,喻晓莉,杨国才;搜索引擎排名改进算法分析[J];农业网络信息;2005年02期
8 丁岳伟;郭辉;;利用蚁群算法对PageRank算法的改进[J];计算机应用;2009年10期
9 蔡建超;蔡明;;搜索引擎PageRank算法研究[J];计算机应用与软件;2008年09期
10 王秀平;马保权;李治柱;;企业专用搜索引擎的搜索策略[J];计算机与现代化;2006年11期
中国博士学位论文全文数据库 前5条
1 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
2 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
3 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
4 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
5 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
中国硕士学位论文全文数据库 前10条
1 丛帅;基于关键资源的网站分类研究[D];哈尔滨工业大学;2010年
2 吴相智;基于XML的Web数据抽取技术的研究[D];中南大学;2005年
3 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年
4 赵佳鹤;基于语义分析的网络信息采集算法研究与应用[D];大连理工大学;2006年
5 姜鑫维;基于分布式的智能搜索引擎[D];武汉理工大学;2006年
6 陈洁惠;搜索引擎排序算法的研究[D];河海大学;2007年
7 张园园;基于用户兴趣的个性化搜索引擎的分析与研究[D];燕山大学;2006年
8 郝金隆;网络原创文章优先的搜索引擎排序算法研究[D];重庆大学;2007年
9 薛玮;网络舆情信息挖掘系统的研究[D];北京交通大学;2008年
10 方旭;基于链接相似度的网页排序算法研究[D];南京理工大学;2008年
【同被引文献】
中国期刊全文数据库 前10条
1 张晓波,王蕾,韩永国;基于智能Agent的个性化信息检索系统[J];安阳师范学院学报;2004年02期
2 卢效峰,郑权;基于用户行为分析的搜索引擎模型[J];北方工业大学学报;2004年03期
3 韩建保;罗小江;;基于数据挖掘的坦克传动装置故障征兆识别展望[J];车辆与动力技术;2005年04期
4 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
5 曲文龙;杨炳儒;张克君;;基于广义后缀树的事件序列频繁情节挖掘算法[J];北京科技大学学报;2006年05期
6 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
7 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
8 颜志军;毕海玲;;电子政务信息资源共享的重复博弈分析[J];北京理工大学学报;2011年01期
9 薛为民;陆玉昌;;文本挖掘技术研究[J];北京联合大学学报(自然科学版);2005年04期
10 梅翔;孟祥武;陈俊亮;徐萌;;一种基于语义关联的查询优化方法[J];北京邮电大学学报;2006年06期
中国博士学位论文全文数据库 前10条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
3 史迎春;基于内容的视频检索语义提取若干问题研究[D];南京理工大学;2005年
4 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
5 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
6 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
7 鲁松;自然语言处理中词相关性知识无导获取和均衡分类器构建[D];中国科学院研究生院(计算技术研究所);2001年
8 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
9 刘悦;WWW上链接分析算法的若干研究[D];中国科学院研究生院(计算技术研究所);2004年
10 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前10条
1 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
2 黄素珍;并行多元搜索引擎的研究与设计[D];广西大学;2001年
3 赵志荣;个性化搜索引擎的研究、设计与实现[D];四川大学;2002年
4 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
5 王明燕;基于WEB页面的关键词与关键概念提取技术[D];北京工业大学;2003年
6 代学武;基于神经网络的用户建模和Web信息过滤研究[D];西南师范大学;2003年
7 刘晓东;基于Web的网络数据库安全技术研究[D];武汉理工大学;2003年
8 陈先;智能搜索引擎关键技术研究与实现[D];哈尔滨工程大学;2003年
9 刘琨;搜索引擎的研究与实现[D];西安电子科技大学;2004年
10 胡珍新;面向用户的查询扩展研究与实现[D];江西师范大学;2004年
【二级引证文献】
中国期刊全文数据库 前10条
1 赵云泽;王珏;王洁;;搜索引擎:三重属性的矛盾及解决途径[J];当代传播;2010年05期
2 张斌;周尔宁;张丹阳;;SEO技术在网站开发中的应用[J];电脑编程技巧与维护;2009年14期
3 叶琳莉;林嵩凯;;基于Web结构挖掘算法的网站构建[J];电脑知识与技术;2008年34期
4 刘春英;吴德华;宋烨;;一种基于统计的数字电视信息过滤算法[J];电视技术;2010年07期
5 张玉宝;;中文搜索引擎的原理及相关技术分析[J];福建电脑;2008年01期
6 崔立波;吴迪;;基于本体的主题信息采集技术的研究[J];硅谷;2010年16期
7 史旗凯;郭菊娥;;基于SMA信息抽取的主题诊断研究[J];管理工程学报;2010年01期
8 张黎烁;李鑫;徐猛;;基于PageRank的网页主题相关性算法研究[J];光盘技术;2008年12期
9 陈志雄;朱向庆;;基于内容评价与超链分析的主题爬虫策略[J];广西轻工业;2011年03期
10 王向阳;马军;;一个基于PageRank的科技文献质量评价算法[J];广西师范大学学报(自然科学版);2009年01期
中国重要会议论文全文数据库 前1条
1 吴晨生;刘彦君;张鲁冀;董晓晴;;科普搜索的研究与实现[A];数字博物馆研究与实践(2009)[C];2010年
中国博士学位论文全文数据库 前10条
1 谢超;自适应地图可视化关键技术研究[D];解放军信息工程大学;2009年
2 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
3 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
4 吴江;基于本体的知识管理系统关键技术研究[D];西北大学;2007年
5 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
6 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
7 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
8 孙静宇;基于CBR的协同Web搜索研究[D];太原理工大学;2010年
9 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
10 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
2 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
3 刘文辉;基于链接结构的网页排序算法研究[D];哈尔滨工程大学;2010年
4 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
5 耿倩;基于文本相似度计算的文本聚类算法研究与实现[D];哈尔滨工程大学;2010年
6 吴迪;高校毕业生就业推荐系统的设计与开发[D];大连理工大学;2010年
7 吴世勇;基于聚类分析的搜索引擎自动性能评价研究[D];江西师范大学;2010年
8 范春晓;基于XML的Web信息抽取技术研究[D];沈阳理工大学;2010年
9 史磊峰;移动垂直搜索系统的研究[D];北京交通大学;2010年
10 李娟;电信公司薪酬管理系统的设计与实现[D];电子科技大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 杨超;李杰;李浩宇;;基于PageRank的页面排序算法研究[J];电脑编程技巧与维护;2011年16期
2 贺全荣;;轻松解锁网页 随意复制粘贴[J];电脑迷;2011年12期
3 王福海;;基于PageRank的主题过滤算法改进[J];科技信息;2011年15期
4 孙敏;;给网页遮羞 拒黄图通行[J];电脑迷;2011年18期
5 李远方;邓世昆;闻玉彪;韩月阳;;Hadoop-MapReduce下的PageRank矩阵分块算法[J];计算机技术与发展;2011年08期
6 阚文浩;;巧制网页 在淘宝购物中赚“回扣”[J];电脑爱好者;2011年11期
7 黄伟光;;网页木马及其防范[J];保密科学技术;2011年05期
8 倪靖;;一种基于云计算的Web结构挖掘算法[J];电脑知识与技术;2011年24期
9 阎皓的皓;;选择性屏蔽网页中的音乐[J];电脑迷;2011年18期
10 ;教你几招识别和防御Web网页木马好方法[J];计算机与网络;2010年Z1期
中国重要会议论文全文数据库 前10条
1 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 白清源;林锦贤;谢丽聪;;信息自动获取系统的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
4 冯艳卉;洪宇;颜振祥;姚建民;朱巧明;;基于搜索引擎的双语混合网页识别新方法[A];第六届全国信息检索学术会议论文集[C];2010年
5 江志纲;丁增喜;刘洋;王大玲;鲍玉斌;于戈;;基于面向属性规约方法的网页和超链的分类[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
6 孔辉;梁洪亮;辛阳;杨义先;陈林顺;;一种高性能的网页篡改检测与恢复机制[A];2010年全国通信安全学术会议论文集[C];2010年
7 刘晖;赵萍;;新疆环境气象中心网站的总体规划及建设[A];信息技术在气象领域的开发应用论文集(一)[C];2005年
8 李立宗;高铁杠;陈蓉;陈超;;基于混沌系统的web信息隐藏研究与实现[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
9 王玉龙;叶新铭;李秀华;;网页优化策略的模糊C均值(FCM)聚类算法研究(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 朱建国;孙钟德;刘婷;;地市级网络管理监控初探[A];“推进气象科技创新,提高防灾减灾和应对气候变化能力”——江苏省气象学会第七届学术交流会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 本报记者 杨阳;“我要玩”:网页游戏集中营[N];经济观察报;2009年
2 商报记者 金朝力;网页游戏繁华之后难掩衰落[N];北京商报;2009年
3 本报记者 廖庆升;网游巨头纷纷“涉水” 网页游戏面临洗牌[N];通信信息报;2009年
4 付燕;8000万元联合风投搅动网页游戏市场[N];中国高新技术产业导报;2009年
5 刘思齐;网页游戏的春天即将来临或将赶超大型网游[N];中国高新技术产业导报;2009年
6 许冰洲 鞠金华;全国首个网页游戏孵化器欲成网页游戏产业基地[N];嘉兴日报;2009年
7 商报记者 李鹏;网页游戏:成长的烦恼[N];中国图书商报;2009年
8 本报记者 王燕;网页游戏同质化严重遭恶意竞争[N];中国消费者报;2010年
9 商报记者 王可;网页游戏:网游下一座“金池”[N];北京商报;2010年
10 本报记者 马子雷;社交网页游戏:存活几率如同中彩票[N];中国文化报;2010年
中国博士学位论文全文数据库 前10条
1 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
2 覃健诚;网络多层纵深防御体系的关键技术研究[D];北京邮电大学;2011年
3 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
4 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
5 王菁华;文本中知识的获取[D];北京邮电大学;2008年
6 黄小广;港美经济关系研究[D];暨南大学;2008年
7 宣云干;基于潜在语义分析的社会化标注系统标签语义检索研究[D];南京大学;2011年
8 窦平安;电子商务语义信息共享模式[D];吉林大学;2009年
9 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
10 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 吕克强;Web超链分析及其在搜索引擎中的应用研究[D];中国石油大学;2008年
2 云颖;复杂网络中的社区发现及进化研究[D];河北大学;2011年
3 孙学刚;面向奥运的中文网页信息获取方法的初步研究[D];清华大学;2004年
4 邓凯英;基于Web信息检索的链接分析算法研究[D];东北师范大学;2008年
5 黄辉;基于LSI和SVC的网页文本分类算法研究[D];长沙理工大学;2010年
6 张晓宇;农业网站中垃圾网页过滤方法的研究[D];新疆大学;2011年
7 王祥冰;个人网页人际意义构建的多模态分析[D];西南交通大学;2012年
8 姜玥旭;PageRank算法的改进及在生物网络数据上的应用[D];吉林大学;2012年
9 李剑楠;基于链接分析的优质网站排名算法[D];吉林大学;2012年
10 邱鹏;移动终端网页转换系统的设计与实现[D];大连理工大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026