收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于LDA的多特征融合的短文本相似度计算

张小川  余林峰  张宜浩  
【摘要】:近年来,LDA(Latent Dirichlet Allocation)主题模型通过挖掘文本的潜在语义主题进行文本表示,为短文本的相似度计算提供了新思路。针对短文本特征稀疏,应用LDA主题模型易导致文本相似度计算结果缺乏准确性的问题,提出了基于LDA的多特征融合的短文本相似度算法。该方法融合了主题相似度因子ST(Similarity Topic)和词语共现度因子CW(Co-occurrence Words),建立了联合相似度模型以规约不同ST区间下CW对ST产生的约束或补充条件,并最终权衡了准确性更高的相似度结果。对改进后的算法进行文本聚类实验,结果表明改进后的算法在F度量值上取得了一定程度的提升。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张小川;余林峰;张宜浩;;基于LDA的多特征融合的短文本相似度计算[J];计算机科学;2018年09期
2 倪高伟;李涛;刘峥;;结合语义和结构的短文本相似度计算[J];计算机技术与发展;2018年08期
3 吕亚伟;李芳;戴龙龙;;基于LDA的中文词语相似度计算[J];北京化工大学学报(自然科学版);2016年05期
4 孙昌年;郑诚;夏青松;;基于LDA的中文文本相似度计算[J];计算机技术与发展;2013年01期
5 朱志鹏;杜建强;刘英锋;喻芳;罗计根;;基于LDA主题模型的中医药方剂相似度计算[J];计算机应用研究;2017年06期
6 田芳;;基于词语情感倾向的问句相似度计算[J];安庆师范学院学报(自然科学版);2014年02期
7 谷志锋;刘勇;郭跟成;;基于相似度计算的本体映射优化方法[J];计算机工程;2008年19期
8 郑志蕴;贾春园;王振飞;李钝;;基于微博的用户相似度计算研究[J];计算机科学;2017年02期
9 徐浩广;王宁;刘佳明;邱燕;;基于自然语言检索的综合相似度计算算法[J];计算机系统应用;2017年06期
10 江长柱;明晓乐;张东香;;基于抽象知识点模型的句子相似度计算[J];计算机系统应用;2015年05期
11 崔春华;李华;;基于本体的概念相似度计算的改进[J];世界科技研究与发展;2013年02期
12 冉婕;孙瑜;;语义检索中的词语相似度计算研究[J];计算机技术与发展;2011年04期
13 邸书灵;刘晓飞;李欢;;基于分词的语句相似度计算的改进[J];石家庄铁道大学学报(自然科学版);2011年04期
14 王钧;赵曰利;;浙大中药指纹图谱相似度计算软件在烟用香精香料色谱分析中的引入应用[J];现代仪器;2007年03期
15 张培颖;;多特征融合的语句相似度计算模型[J];计算机工程与应用;2010年26期
16 贾明静;董日壮;段良涛;;问句相似度计算综述[J];电脑知识与技术;2014年31期
17 胡秀;黎亚雄;;本体映射过程中的综合相似度计算[J];电脑学习;2011年02期
18 胡哲;郑诚;;改进的概念语义相似度计算[J];计算机工程与设计;2010年05期
19 王秀红;袁艳;赵志程;李洁玉;刘海军;杨国立;;专利文献的结构树模型及其在相似度计算中的应用[J];情报理论与实践;2015年03期
20 徐健;方安;洪娜;;一种基于词语相似度计算的本体映射方法[J];现代图书情报技术;2013年02期
中国重要会议论文全文数据库 前10条
1 赵妍妍;秦兵;刘挺;张俐;苏中;;基于多特征融合的句子相似度计算[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 林民;宋柔;;基于结构描述的汉字字形相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年
4 郭文宏;范学峰;;基于语义词典和本体知识的概念相似度计算[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
5 刘磊;张桂平;蔡东风;季铎;;基于语义预测的双语术语相似度计算[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
6 张亮;尹存燕;陈家骏;;基于语义树的中文词语相似度计算与分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
8 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 王中友;肖鹰;吴哲夫;;基于用户喜好的个性推荐系统优化[A];浙江省电子学会2014学术年会论文集[C];2014年
10 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 彭佳杰;基因本体术语相似度计算和扩展方法研究[D];哈尔滨工业大学;2015年
2 冯晓文;基于GPU的相似度计算关键技术研究[D];华中科技大学;2014年
3 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年
4 徐康;基于主题模型的文本情感和话题建模的研究[D];东南大学;2017年
5 胡卉芪;空间文本数据的量质融合与推送[D];清华大学;2016年
6 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年
7 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
8 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
9 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
10 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
中国硕士学位论文全文数据库 前10条
1 王凯强;大数据环境下的用户信息抽取与分析[D];北京邮电大学;2018年
2 高森;农业问答系统中问题分类和相似度计算的研究[D];中国科学技术大学;2018年
3 赵倩倩;词语相似度计算及其在语义选择限制知识获取中的应用研究[D];郑州大学;2018年
4 马莺歌;基于语义的政策血缘网络演化机理研究[D];哈尔滨工程大学;2015年
5 洪玄贵(WUTTHITHANAKON WUTTHIPONG);泰语句子相似度计算研究[D];昆明理工大学;2017年
6 张玉娟;基于《知网》的句子相似度计算的研究[D];中国地质大学(北京);2006年
7 张猛;基于话题的事件相似度计算[D];河北大学;2014年
8 薛慧芳;句子相似度计算理论及应用研究[D];西北大学;2011年
9 高慧星;本体映射中概念相似度计算研究[D];燕山大学;2013年
10 郜强;基于语义词语相似度计算模型的研究与实现[D];西安电子科技大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978