收藏本站
《计算机科学》 2011年S1期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

LDA模型在话题追踪中的应用

张晓艳  王挺  梁晓波  
【摘要】:随着对LDA模型的研究越来越深入,文本表示和挖掘能力进一步提高。"话题"是LDA模型中一个非常重要的概念,是特征集合的一个多项式概率分布。话题追踪是根据少数已知相关信息在未知报道流中追踪一个话题,找出与该话题相关的所有报道。把LDA模型用于话题追踪,目的有两个:(一)检验LDA话题对追踪话题的表示能力;(二)检验LDA模型在挖掘训练数据中的追踪话题时,LDA话题和追踪话题之间的关系。实验表明:相对于经典的向量空间模型和一元语言模型,以及专门针对追踪话题提出的事件模型,基于LDA模型的追踪性能更好,但由于粒度不同,LDA模型中的话题和追踪话题并没有直接的一一对应的关系,实现可定制话题的LDA模型是下一步工作的目标。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王英帅;李培峰;朱巧明;;一种基于LDA和上下文摘要的Web人名消歧方法[J];计算机应用与软件;2011年07期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 王会珍;朱靖波;季铎;张斌;;基于多向量模型的中文话题追踪[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 王会珍;朱靖波;季铎;叶娜;张斌;;基于反馈学习自适应的中文话题追踪[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
中国博士学位论文全文数据库 前1条
1 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前9条
1 王会珍;面向话题追踪的特征选取与文本表示技术的研究[D];东北大学;2005年
2 丁若尧;基于博客的网络话题发现及追踪的研究[D];北京交通大学;2011年
3 王铁成;无重叠视域中多摄像头目标检测与匹配[D];苏州大学;2012年
4 刘旭;基于互联网数据的话题发现及追踪技术研究与实现[D];复旦大学;2010年
5 王英帅;Web人名消歧方法的研究与实现[D];苏州大学;2010年
6 暴艳;多领域的文本情感倾向分类方法研究[D];山西大学;2012年
7 宁健;面向生物医学领域的跨语言信息检索[D];大连理工大学;2010年
8 王力;基于查询扩展的信息抽取技术研究及应用[D];苏州大学;2011年
9 葛艳艳;基于社会标签系统的推荐技术研究[D];大连理工大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978