收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于LDA模型的主题分析

石晶  范猛  李万龙  
【摘要】:在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片段边界.依据词汇的香农信息提取片段主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵.实验表明,文本分析的结果明显好于其他方法,可以为下一步文本推理的工作提供有价值的预处理.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陶莉;涂静文;;数据仓库技术在移动通信中的应用[J];科技信息;2009年23期
2 陈琼杰;;一种针对公安系统信息的数据仓库建设方案[J];科技风;2010年16期
3 石晶;范猛;李万龙;;基于LDA模型的主题分析[J];自动化学报;2009年12期
4 卢廷杰;;供电企业数据仓库中的主题分析与应用[J];信息技术与信息化;2009年02期
5 罗兴军;白晓波;;基于事件驱动模型的搜索引擎设计[J];电脑知识与技术;2011年28期
6 石晶;李万龙;;基于LDA模型的主题词抽取方法[J];计算机工程;2010年19期
7 石晶;李万龙;;三种主题分割方法的对比研究[J];计算机工程与应用;2009年18期
8 石晶;胡明;石鑫;戴国忠;;基于LDA模型的文本分割[J];计算机学报;2008年10期
9 刘铭;王晓龙;刘远超;;基于主题分析的文本分割技术研究[J];电子学报;2009年02期
10 甄超;宋爽;许洁萍;;多模态音乐流派分类研究[J];计算机科学与探索;2011年01期
11 吕韶华;杨亮;林鸿飞;;基于LDA模型的餐馆评论排序[J];计算机工程;2011年19期
12 刘立超;刘小秋;赵岩;;跨业务主题分析的研究与应用[J];电力信息化;2010年07期
13 杨彬蔚;张怡芳;;基于图像视觉特征与LDA模型的取景图像识别[J];计算机与现代化;2011年05期
14 王志农;;园林科技文献数据库的检索及标引[J];园林科技信息;1997年01期
15 张伟;;数据挖掘领域的文献计量学研究[J];图书与情报;2005年06期
16 石晶;胡明;戴国忠;;基于小世界模型的中文文本主题分析[J];中文信息学报;2007年03期
17 张大平;;省集中模式的县供电企业营销信息监控系统[J];福建电脑;2010年01期
18 黄黎;赵朋朋;方巍;崔志明;孙振强;;基于世界知识的深网数据源增强分类模型[J];计算机工程;2010年08期
19 吴永辉;王晓龙;丁宇新;徐军;郭鸿志;;基于主题的自适应、在线网络热点发现方法及新闻推荐系统[J];电子学报;2010年11期
20 王英帅;李培峰;朱巧明;;一种基于LDA和上下文摘要的Web人名消歧方法[J];计算机应用与软件;2011年07期
中国重要会议论文全文数据库 前6条
1 朱靖波;陈文亮;姚天顺;;面向TDT的主题相似性计算模型[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 李素建;李芸;纪鹭宁;徐睿峰;;词典匹配和串频统计相结合在自动主题分析中的应用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 苏贵洋 ;李建华 ;马颖华;;XML统一文本自动处理描述接口[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 王君珂;王柏;艾波;;I~3DSS在电信行业CRM系统中的应用[A];’2004计算机应用技术交流会议论文集[C];2004年
5 任家东;李志国;宗俊省;刘欣;;基于特征值的数据仓库主题搜索算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
6 郑妍;肖桐;朱靖波;;基于Bootstrapping的领域多词串自动获取[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前1条
1 周亦鹏;基于软件人的情境主题分析及应用研究[D];北京科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 孙双;基于本体的BLOG文档自动摘要关键技术研究与实现[D];华东师范大学;2009年
2 孙荣霜;面向主题的多Agent搜索系统[D];扬州大学;2008年
3 梁文婷;汉语文本主题分析技术的研究与实现[D];重庆大学;2008年
4 孙珂;网站主题分析、标引与检索技术的研究[D];哈尔滨工业大学;2006年
5 季松;基于数据仓库的数据挖掘技术在房地产中介信息分析系统的研究和应用[D];华东师范大学;2007年
6 石得富;运用J2EE架构支撑多维数据分析的电信经营分析系统[D];重庆大学;2008年
7 李玉华;面向主题的舆情采集搜索爬虫的设计与实现[D];山东大学;2009年
8 吴春英;基于数据仓库的数据挖掘技术在电信信息分析系统中的研究与应用[D];华东师范大学;2006年
9 刘平;基于电信决策支持系统的产品分析模块的设计和应用[D];北京邮电大学;2008年
10 王铁成;无重叠视域中多摄像头目标检测与匹配[D];苏州大学;2012年
中国重要报纸全文数据库 前9条
1 ;主题分析加速CRM变革[N];通信产业报;2005年
2 ;山东国税税收监控数据分析应用[N];计算机世界;2006年
3 ;构建智能化电信企业[N];计算机世界;2001年
4 廉夙;探求数据之“道”[N];中国劳动保障报;2009年
5 张巧英;大唐电信经营分析系统解决方案[N];通信产业报;2003年
6 ;全力推进OSS技术[N];人民邮电;2002年
7 ;亚信OmniCRM解决方案[N];中国电子报;2002年
8 ;如何成功建设资源管理系统[N];人民邮电;2004年
9 ;数据挖掘提升杭州电信[N];网络世界;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978