收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于主题相关度的网页排序算法

吴炜  梁昆  李瑞轩  辜希武  卢正鼎  
【摘要】:针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法.通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法.理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 关慧芬;师军;马继红;;基于遗传算法的主题爬行技术研究[J];计算机与数字工程;2008年10期
2 彭冬;蔡皖东;;面向Web论坛的网络信息获取技术及系统实现[J];计算机工程与科学;2011年01期
3 汪涛,樊孝忠;主题爬虫的设计与实现[J];计算机应用;2004年S1期
4 王奇,宋国新,邵志清;信息检索中基于链接的网页排序算法[J];华东理工大学学报;2000年05期
5 郑建华,赵政;Web页面排序算法研究[J];微处理机;2003年05期
6 余锦,史树明;分布式网页排序算法及其传输模式分析[J];计算机工程与应用;2004年29期
7 李世明;赵恒永;;专题搜索引擎研究与实现——信息过滤[J];电子科学技术评论;2005年04期
8 马海波;陈时勇;;基于网页等级的PageRank算法改进[J];大连交通大学学报;2010年02期
9 何国斌;赵晶璐;;Web页面主题相关性排序算法的研究[J];计算机工程与应用;2009年23期
10 钱功伟;倪林;曹荣;;基于网页链接和内容分析的改进PageRank算法[J];计算机工程与应用;2007年21期
11 汤大权;唐九阳;刘健;肖卫东;;主题覆盖P2P网络自组织构造方法[J];计算机工程与科学;2009年01期
12 关慧芬;师军;;基于本体的主题爬虫技术研究[J];计算机仿真;2009年10期
13 彭聪;吴强;李仁发;;一种改进型的网页排序算法[J];微计算机信息;2010年33期
14 袁浩;黄烟波;;网页标题分析对主题爬虫的改进[J];计算机技术与发展;2009年06期
15 田甜;倪林;钱功伟;;一种结合社区发现的网页排序算法[J];计算机工程与应用;2007年12期
16 张芳;;基于用户行为的PageRank算法[J];福建电脑;2009年06期
17 郑冬冬;崔志明;;Deep Web查询接口选择[J];计算机应用;2006年09期
18 郑国良;叶飞跃;张滨;林国俊;;基于网页内容和链接价值的相关度方法的实现[J];计算机工程与设计;2008年23期
19 刘建;孙鹏;倪宏;;面向分类的网页主题特征提取[J];计算机应用研究;2010年09期
20 刘红,邵晓良,胡吉兵;基于页面内容和链接结构的超链接主题预测算法[J];现代图书情报技术;2005年05期
中国重要会议论文全文数据库 前1条
1 吴炜;梁昆;李瑞轩;辜希武;卢正鼎;;一种基于主题相关度的网页排序算法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
中国博士学位论文全文数据库 前2条
1 刘玉婷;网页排序中的随机模型及算法[D];北京交通大学;2009年
2 韩晓晖;Web社会媒体中信息的质量评价及应用研究[D];山东大学;2012年
中国硕士学位论文全文数据库 前10条
1 冯东庆;基于链接分析的网页排序作弊检测方法研究[D];吉林大学;2011年
2 刘文辉;基于链接结构的网页排序算法研究[D];哈尔滨工程大学;2010年
3 李正文;基于SVM分类算法的主题爬虫研究[D];哈尔滨工程大学;2011年
4 高文梁;改进的基于历史信息分析的网页排序算法[D];大连理工大学;2009年
5 邵晶晶;基于PageRank排序算法改进的若干研究[D];华中师范大学;2009年
6 关鑫;网页综合信息与领域本体相结合的主题爬行研究[D];吉林大学;2010年
7 柳淑升;DistanceRank与HITS混合的网页排序算法研究[D];东北师范大学;2010年
8 陈小飞;基于链接分析的网页排序及相关Link Spam算法的研究[D];复旦大学;2011年
9 周思思;基于隐马尔科夫模型的网络舆情挖掘[D];中南林业科技大学;2012年
10 连惠杰;基于主题的教育信息定向采集系统[D];南京理工大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978