收藏本站
《北京信息科技大学学报(自然科学版)》 2017年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种发现新浪微博优质用户的方法

逯倩倩  都云程  
【摘要】:基于信任转移模型和广度优先遍历的算法思想,提出了一种用于发现新浪微博优质用户的方法。选择10个领袖用户作为爬虫的种子用户,基于用户好友关系采用广度优先遍历算法进行用户信息采集。对采集到的结果从用户好友、粉丝情况及用户重复率角度进行了分析,发现随采集深度的增加,用户质量会有所下降,采集深度到达一定值时,优质用户规模不会有太大变化。通过与"热门微博TOP10"用户对比表明,该方法能够发现相对优质的微博用户。
【作者单位】北京信息科技大学计算机学院;北京拓尔思信息技术股份有限公司研发部;
【基金】:863计划课题“面向基础教育的知识能力智能测评与类人答题验证系统”(2015AA015409)
【分类号】:TP393.092
【正文快照】:
0引言互联网时代用户是核心竞争资源,但是很少有研究者为微博上的优质用户建立数据集。本文所指的优质用户是从用户关系出发,具有一定可信粉丝和好友的用户。为了发现优质微博用户,一种流行的做法是计算每位用户的权重,类似于著名的PageRank。FollowRank是简单利用用户的粉丝

中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026