一种基于主题相关度的网页排序算法
【摘要】:针对现有基于链接结构的PageRank算法的不足,提出了基于网页主题相关度的改进PageRank算法.通过分析网页内容,提取出网页中的链接及其对应的锚文本,建立网页链接库,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度,在此基础上实现离线计算改进后的PageRank算法.理论分析和仿真实验表明,改进的PageRank算法使用户能方便地找到所需网页,提高了网页查询效率.
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||
|
|
|||||
|
|
|||||||||||||||||||||
|