收藏本站
《计算机研究与发展》 2011年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于MB-LDA模型的微博主题挖掘

张晨逸  孙建伶  丁轶群  
【摘要】:随着微博的日趋流行,Twitter等微博网站已成为海量信息的发布体,对微博的研究也需要从单一的用户关系分析向微博本身内容的挖掘进行转变.在数据挖掘领域,尽管传统文本的主题挖掘已经得到了广泛的研究,但对于微博这种特殊的文本,因其本身带有一些结构化的社会网络方面的信息,传统的文本挖掘算法不能很好地对它进行建模.提出了一个基于LDA的微博生成模型MB-LDA,综合考虑了微博的联系人关联关系和文本关联关系,来辅助进行微博的主题挖掘.采用吉布斯抽样法对模型进行推导,不仅能挖掘出微博的主题,还能挖掘出联系人关注的主题.此外,模型还能推广到许多带有社交网络性质的文本中.在真实数据集上的实验表明,MB-LDA模型能有效地对微博进行主题挖掘.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李媛;思金华;郝彧;;微博在高校图书馆的应用研究[J];科技情报开发与经济;2011年21期
2 郭萍;;从“抢盐风波”看微博在舆论监督上的作为[J];新闻传播;2011年05期
3 王昕初;;浅析网络微博中的议程设置[J];今传媒;2011年06期
4 李映曦;王美丽;;浅谈博客教学在《网络营销》课程中的应用[J];湖南农机;2011年05期
5 梁巧华;;试论图书馆的新兴信息宣传工具——微博[J];科技情报开发与经济;2011年20期
6 杨帅;吴卫娟;;我国图书馆微博现状调查分析[J];图书馆学研究;2011年16期
7 曹丽冰;;浅析微博在图书馆读者服务工作中的作用[J];科技资讯;2011年21期
8 文晓欢;;浅析以微博为代表的信息传播碎片化——以“新浪微博”为例[J];北方文学(下半月);2011年06期
9 李剑;;微博在高校图书馆信息服务中的应用[J];高校图书馆工作;2011年04期
10 唐嘉仪;;意见领袖对微博公益传播的作用[J];新闻世界;2011年08期
11 蒋颖;;微博:开创民意表达新途径[J];湘潮(下半月);2011年07期
12 李宗峰;;如何编辑平面媒体的微博?[J];新闻爱好者;2011年17期
13 李帆;刘昕明;;微博与公共领域建构的关系思考[J];新闻传播;2011年06期
14 董海军;曾淑萍;;从博客到微博:过程特征、意义建构与挑战[J];中国青年研究;2011年09期
15 曹旻;赵景明;;微博在大学生信息素养教育中的应用初探[J];湖南师范大学教育科学学报;2011年04期
16 李秋红;陈晶;;博客伦理初探[J];学理论;2011年17期
17 杨俊;;试论微博对公共领域形成和发展的影响[J];新闻世界;2011年07期
18 王德辉;魏霞;;浅谈微博传播的社会效应[J];新闻世界;2011年07期
19 冯建成;;微博在高等教育中的应用研究[J];中国教育技术装备;2011年18期
20 刘洋;;微博讨论话语的民粹化倾向——以新浪微博为例[J];东南传播;2011年07期
中国重要会议论文全文数据库 前10条
1 刁宇峰;林鸿飞;;基于LDA模型的博客垃圾评论发现[A];第六届全国信息检索学术会议论文集[C];2010年
2 翁伟;王厚峰;;基于LDA的关键词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 董婧灵;李芳;何婷婷;涂新辉;万剑;;基于LDA模型的文本聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 谢华;刘建华;田于逵;;湍流积分长度的HWA与LDA联合测试分析方法研究[A];第十三届船舶水下噪声学术讨论会论文集[C];2011年
5 刘振鹿;王大玲;冯时;张一飞;方东昊;;一种基于LDA的潜在语义区划分及Web文档聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
6 张明慧;王红玲;周国栋;;LDA主题驱动的中文多文档自动文摘方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 王秀娟;郑康锋;杨星海;;线性鉴别分析在中文文本分类中的应用[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
8 陆寒冰;刘春江;刘辉;袁希钢;;立交盘静态混合器的流场研究[A];第三届全国化学工程与生物化工年会论文摘要集(上)[C];2006年
9 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
10 李文波;孙乐;;一种LDA模型的高效并行求解算法[A];第六届全国信息检索学术会议论文集[C];2010年
中国重要报纸全文数据库 前10条
1 ;市场凸显消费升级的“财富效应”[N];上海证券报;2007年
2 石海平;结构分化的牛市需要挖掘主题[N];中国经营报;2006年
3 耿兴余;摄影亦是《艰难都在征途上》[N];中国摄影报;2007年
4 甬欣文;千言万语只为瞬间感动[N];中国新闻出版报;2007年
5 记者 吴晓鹏 通讯员 沈荣江 陈屹华;宁波慈城:投资七亿元打造“儒城”[N];浙江日报;2003年
6 本报记者  李剑锋;招商证券:A股市场离泡沫还远[N];上海证券报;2006年
7 聂伟;实时悬疑剧“克隆”何时休[N];文汇报;2006年
8 汇阳投资;热点演变出现三大新动向[N];上海证券报;2006年
9 许向群 王心刚;军事美术精品荟萃献礼“八一”[N];文艺报;2007年
10 本报记者 孙丁玲;在理性发展中走向春天[N];中华新闻报;2007年
中国博士学位论文全文数据库 前9条
1 李广建;个性化网络信息检索系统的研究与实现[D];中国科学院研究生院(文献情报中心);2002年
2 李博;基于LDA和LSA的医学文本和影像分析模型及应用研究[D];吉林大学;2012年
3 谷芳;规整填料局部流动与传质的计算流体力学研究[D];天津大学;2004年
4 武志超;LDA抽运高频Nd:YAG陶瓷激光器研究[D];长春理工大学;2010年
5 姜嘉言;用于人脸识别的产生式模型和判别式模型中若干问题的研究[D];复旦大学;2009年
6 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
7 张春梅;SK型静态混合器流动特性研究[D];天津大学;2009年
8 付志新;奶牛真胃左方变位的病因与临床病理学研究[D];扬州大学;2009年
9 常鹏;基于词共现的文本主题挖掘模型和算法研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 董婧灵;基于LDA模型的文本聚类研究[D];华中师范大学;2012年
2 李春晓;基于LDA的人脸识别[D];西安电子科技大学;2011年
3 宋志理;基于LDA模型的文本分类研究[D];西安理工大学;2010年
4 闫泽华;基于LDA的新闻线索抽取研究[D];上海交通大学;2012年
5 卢健;面向文本的主题挖掘技术与实现[D];济南大学;2010年
6 许孝芳;大功率半导体激光器列阵与光纤耦合的研究[D];吉林大学;2006年
7 徐培培;基于LNP的半监督学习算法[D];西安电子科技大学;2009年
8 宋健;基于主题挖掘和时间窗口划分的兴趣推荐技术研究[D];华东师范大学;2011年
9 谢静;基于LDA与SVM的文本分类研究[D];河北大学;2012年
10 谢永林;线性特征提取及其在人脸识别中的应用[D];复旦大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978