收藏本站
《大连理工大学学报》 2005年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于语义理解的文本相似度算法

金博  史彦军  滕弘飞  
【摘要】:相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高.

【相似文献】
中国期刊全文数据库 前10条
1 李广原;杨炳儒;刘永彬;刘英华;;多维序列模式挖掘算法[J];计算机工程与设计;2011年07期
2 安见才让;王玲玲;;一种汉藏双语句子对齐算法[J];微处理机;2011年03期
3 曾劲涛;罗文浪;李金忠;曾小荟;;基于历史信息选择软件可靠性模型的方法[J];井冈山大学学报(自然科学版);2011年03期
4 魏晶晶;杨定达;廖祥文;;基于网页内容相似度改进算法的主题网络爬虫[J];计算机与现代化;2011年09期
5 刘永楠;王宏志;高宏;;MapReduce框架下基于字符串波形的实体识别方法[J];计算机科学与探索;2011年08期
6 寿思聪;姚从磊;李晓明;;发现维基百科文章相关图片[J];计算机科学与探索;2011年07期
7 卫佳君;宋继华;;自动文摘的方法研究[J];计算机技术与发展;2011年08期
8 周运;刘栋;;基于语义相似度的领域本体概念更新方法研究[J];计算机工程与设计;2011年08期
9 陈晓光;李岩;;针对二维矢量图形数据的盲水印算法[J];计算机应用;2011年08期
10 秦彩云;;云模型用于特征加权及降维的算法[J];计算机系统应用;2011年06期
中国重要会议论文全文数据库 前10条
1 金保华;高湘飞;柳雪环;张磊;;基于XML框架与CBR智能预案管理的研究[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
2 王超;许方;;一种基于奇异值分解的印刷体数字识别算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
3 刘海波;郑德权;赵铁军;;基于相似度线性加权方法的检索结果聚类研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 袁里驰;钟义信;;一种新颖的词聚类算法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
5 潘景昌;程马勇;阎峥;黄垚;黄晓选;;相似度可调的匹配算法的分析与设计[A];2005年全国理论计算机科学学术年会论文集[C];2005年
6 霍星;檀结庆;;基于特征向量的三维模型检索[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 范自柱;;基于曲面插值的图像识别技术[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
8 陈林;汪卫星;;基于分块主色调和相关反馈技术的图像检索方法[A];’2004计算机应用技术交流会议论文集[C];2004年
9 李立;何婷婷;瞿国忠;张勇;;基于文档扩展的中文信息检索系统[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 盛振华;吴羽;江锦华;寿黎但;陈刚;;InfoSigs:一种面向WEB对象的细粒度聚类算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
中国重要报纸全文数据库 前4条
1 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
2 河北师大教师 孟俊茂;翻译软件的评测研究[N];中国特产报;2010年
3 张昕楠;Windows 7安全特性初体验[N];中国计算机报;2009年
4 刘霞;生物识别技术“天生不靠谱”[N];科技日报;2010年
中国博士学位论文全文数据库 前10条
1 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
2 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
3 游扬声;一般分布模式下GIS位置数据的不确定性研究[D];武汉大学;2005年
4 刘建华;粒子群算法的基本理论及其改进研究[D];中南大学;2009年
5 李斌;LZ复杂性算法及其在生物序列分析中的应用研究[D];中南大学;2008年
6 田启川;不完美虹膜的定位分割、特征提取与分类识别[D];西北工业大学;2006年
7 张磊;个性化推荐和搜索中若干关键问题的研究[D];北京邮电大学;2009年
8 赵世奇;基于统计的复述获取与生成技术研究[D];哈尔滨工业大学;2009年
9 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
10 谭武征;基于知识的概念创新设计系统关键技术的研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 王森;基于主题树的自上而下文本复制检测研究[D];大连理工大学;2010年
2 刘双明;文档复制检测的应用研究[D];太原理工大学;2010年
3 卢小康;中文文本复制检测技术研究[D];杭州电子科技大学;2009年
4 李旭;基于串匹配方法的文档复制检测系统研究[D];燕山大学;2006年
5 李婷婷;基于语义结构的学术论文复制检测技术研究与实现[D];北京邮电大学;2010年
6 孙伟;基于文档复制检测技术的研究与实现[D];辽宁工程技术大学;2010年
7 闫小龙;文档复制计算机辅助检测系统的研究与实现[D];太原理工大学;2008年
8 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
9 闵江;基于语义网的本体相似度算法研究[D];华东交通大学;2011年
10 裴运亮;基于切词和语义的中文相似度研究与应用[D];电子科技大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026