收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于改进CURE算法的微博热点话题发现

杨长春  周猛  叶施仁  徐小松  
【摘要】:由于微博平台的信息量大,为对博文热点进行准确识别,本文提出了一种基于经典CURE聚类算法的改进算法来发现微博热点话题。本文选取了20391条中文微博作为样本数据集,通过将博文稀疏矩阵化达到将高维数据降维的效果,很大程度上提高了计算的精度和速度。从选取CURE层次聚类的代表点出发,将代表点转换为博文种子集,同时调节收缩因子,加大排除博文的异常点,利用CURE层次聚类算法的思想设计了改进的CURE算法来发现微博热点话题,通过实验发现改进CURE层次聚类算法能够将数据集中的74.65%作为孤立点,更好的提高了算法的精度,同时准确地抓住长尾效应的"头部",能够更加直观的发现微博热点话题。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 姚远;刘鹏;王辉;笱程成;;基于稀疏矩阵存储的状态表压缩算法[J];计算机应用;2010年08期
2 李永昊;刘云;;网络话题活性模型的仿真与分析[J];系统仿真学报;2008年22期
3 王皓;李祥学;郑东;;基于稀疏矩阵的网络编码安全存储系统[J];信息安全与通信保密;2011年06期
4 倪现君;;结构挖掘中web有向图模型的改进算法[J];微计算机信息;2007年36期
5 贺海武;王宇;;GMRES算法在新型轻量级网格平台XtremWeb上的实现[J];微电子学与计算机;2006年09期
6 张媛媛;侯华;程军;赵宇辉;;一种有限元网格节点编号的优化算法[J];铸造技术;2007年04期
7 刘慧君;朱庆生;张程;周明强;;基于用户兴趣的Web日志挖掘算法[J];计算机集成制造系统;2009年11期
8 刘葵;;基于链接聚类算法分析Blog网页[J];制造业自动化;2010年09期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 樊景超;周国民;周义桃;;基于SDD改进算法的中文农业搜索引擎的研究[A];农业工程科技创新与建设现代农业——2005年中国农业工程学会学术年会论文集第三分册[C];2005年
2 贺海武;王宇;;GMRES算法在新型轻量级网格平台XtremWeb上的实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
中国硕士学位论文全文数据库 前10条
1 罗亚平;基于用户浏览行为的网络热点话题发现模型研究[D];北京邮电大学;2008年
2 周瑞波;网络研究中的大稀疏矩阵求解和通信流量对蠕虫传播推测的影响[D];吉林大学;2008年
3 时达明;Blog热点话题发现及其作者声誉度研究[D];大连理工大学;2007年
4 黄振龙;关于微博热点的WEB挖掘研究[D];华东师范大学;2013年
5 李卉;基于微博的网络突发事件分析研究[D];北京邮电大学;2013年
6 任晓霞;BBS舆情智能分析系统研究与实现[D];沈阳理工大学;2011年
7 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
8 李永道;微博热点话题发现方法研究[D];南京师范大学;2013年
9 鄂华君;基于P2P的网络编码的应用与分析[D];西安电子科技大学;2010年
10 李纯;P2P网络中基于内容的音乐信息检索[D];大连理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978