收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于改进PageRank的情报主题相关度预测策略

韩宇  黄青松  
【摘要】:选择恰当的情报主题相关度预测策略,控制采集情报质量为企业的决策提供正确有效的素材是面向主题的情报采集的核心技术之一。单一依靠文本或链接的情报主题相关度预测策略,不能准确有效地预测待爬网页的价值。该文提出一种基于主题的PageRank算法—Focused PageRank算法来计算网页URL优先级。该方法考虑了页面内容的主题相关度以提高抓取页面的质量,通过网页链接关系预测网页的重要度以提高情报采集的覆盖率。从而提高情报采集的速度和效率,实现不同情报主题下页面URL优先级排序,适应企业竞争情报系统对多主题情报信息的采集。

知网文化
【相似文献】
中国硕士学位论文全文数据库 前1条
1 苏菲菲;精准营销中观点爬取与需求匹配技术的研究与实现[D];东北财经大学;2011年
中国重要报纸全文数据库 前1条
1 隋晓琳;在高新技术领域不辍耕耘[N];中国高新技术产业导报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978