收藏本站
《中文信息学报》 2012年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于线索树双层聚类的微博话题检测

马彬  洪宇  陆剑江  姚建民  朱巧明  
【摘要】:微博作为一种全新的信息发布模式,在极大程度上增强了网络信息的开放性和互动性,但同时也造成微博空间内信息量的裂变式增长。利用话题检测技术将微博文本信息按照话题进行归类和组织,可以帮助用户在动态变化的信息环境下高效获取个性信息或热点话题。该文针对微博文本短、半结构、上下文信息丰富等特点,提出了基于线索树的双层聚类的话题检测方法,通过利用融合了时序特征和作者信息的话题模型(Temporal-Author-Topic,TAT)进行线索树内的局部聚类,借以实现垃圾微博的过滤,最后利用整合后的线索树进行全局话题检测。实验结果显示该方法在解决数据稀疏方面取得了较好的效果,话题检测的F值达到31.2%。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
【共引文献】
中国期刊全文数据库 前1条
1 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期
中国重要会议论文全文数据库 前2条
1 丁伟莉;赵华;郑德权;赵铁军;于浩;;中文Blog热门话题检测与排序技术研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 张阔;李涓子;吴刚;;基于关键词元的话题内事件检测[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国硕士学位论文全文数据库 前3条
1 赵敏涯;基于主题的新闻搜索引擎的研究与实现[D];扬州大学;2006年
2 王丫;网络新闻流中热点事件识别与跟踪算法的改进与验证[D];燕山大学;2007年
3 宋丹;基于语义和链接的话题跟踪方法[D];大连理工大学;2007年
【同被引文献】
中国期刊全文数据库 前5条
1 夏天,樊孝忠,刘林;利用JNI实现ICTCLAS系统的Java调用[J];计算机应用;2004年S2期
2 马保国;侯存军;王文丰;钱方正;;Web数据挖掘技术及应用[J];计算机与数字工程;2006年06期
3 刘金红;陆余良;;主题网络爬虫研究综述[J];计算机应用研究;2007年10期
4 曼丽春,朱宏,杨全胜;Web数据挖掘研究与探讨[J];现代电子技术;2005年08期
5 高岩,胡静涛;Web数据挖掘的原理、方法及用途[J];现代图书情报技术;2002年03期
中国硕士学位论文全文数据库 前1条
1 栾丽华;聚类算法研究[D];南京师范大学;2004年
【二级参考文献】
中国期刊全文数据库 前1条
1 李晓黎,刘继敏,史忠植;基于支持向量机与无监督聚类相结合的中文网页分类器[J];计算机学报;2001年01期
【相似文献】
中国期刊全文数据库 前10条
1 刘美玲;赵铁军;郑德权;于摇洋;;面向TDT的动态多文档文摘研究[J];哈尔滨工业大学学报;2010年11期
2 刘嵩;张先飞;李弼程;孙显著;;基于概念相似度的话题自动检测方法[J];信息工程大学学报;2010年03期
3 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期
4 张阔;李涓子;吴刚;王克宏;;基于关键词元的话题内事件检测[J];计算机研究与发展;2009年02期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国博士学位论文全文数据库 前1条
1 张立;网络舆论传播中若干算法的研究[D];北京交通大学;2009年
中国硕士学位论文全文数据库 前9条
1 张剑峰;微博主观性发现关键技术研究[D];苏州大学;2012年
2 乐可欣;话题检测研究[D];北京交通大学;2009年
3 赵爱华;面向网络新闻的话题检测技术研究[D];山东师范大学;2013年
4 印文涛;基于星型K部图的网络视频话题挖掘和可视化的研究[D];浙江大学;2011年
5 孙胜平;中文微博客热点话题检测与跟踪技术研究[D];北京交通大学;2011年
6 谢林燕;话题检测与跟踪关键技术研究[D];华北电力大学;2012年
7 张美珍;话题检测与跟踪算法的研究[D];北京交通大学;2010年
8 陈应友;基于hadoop的微博文本分类及商业词抽取[D];杭州电子科技大学;2013年
9 袁吕;基于话题检测与跟踪的话题搜索技术研究[D];哈尔滨工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026