收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于朴素贝叶斯模型的单词语义相似度度量

王俊华  左万利  闫昭  
【摘要】:单词语义相似度度量是自然语言处理领域的经典和热点问题.通过结合朴素贝叶斯模型和知识库,提出一个新颖的度量单词语义相似度度量途径.首先借助通用本体WordNet获取属性变量,然后使用统计和分段线性插值生成条件概率分布列,继而通过贝叶斯推理实现信息融合获得后验概率,并在此基础上量化单词语义相似度.主要贡献是定义了单词对距离和深度,并将朴素贝叶斯模型用于单词语义相似度度量.在基准数据集RG(65)上,对比算法评判结果与人类评判结果的相关度,采用5折交叉验证对算法进行分析,样本Pearson相关度达到0.912,比当前最优方法高出0.4%,比经典算法高出7%~13%;Spearman相关度达到0.873,比经典算法高出10%~20%;且算法的运行效率和经典算法相当.实验结果显示将朴素贝叶斯模型和知识库相结合解决单词语义相似度问题是合理有效的.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘俊;;基于语义相似度的关键词生成在企业搜索引擎营销中应用[J];电脑知识与技术;2008年14期
2 宗裕朋;吴刚;;一种基于上下文的语义相似度算法[J];微计算机信息;2008年30期
3 刘春辰;刘大有;王生生;赵静滨;王兆丹;;改进的语义相似度计算模型及应用[J];吉林大学学报(工学版);2009年01期
4 魏韡;向阳;陈千;;计算术语间语义相似度的混合方法[J];计算机应用;2010年06期
5 马续补;郭菊娥;;基于《知网》语义相似度的企业事实主题诊断研究[J];情报杂志;2010年05期
6 江磊;郑彦;余志虎;;基于概念树的语义相似度计算的研究[J];广东通信技术;2010年08期
7 王道平;赵耀;刘涛;;敏捷供应链中知识服务检索的语义相似度问题研究[J];图书情报工作;2010年16期
8 吕强;邓薇;宋玲;;句子语义相似度计算[J];计算机工程与应用;2010年36期
9 吴迪;崔立波;;一种医疗本体语义相似度算法的设计[J];软件工程师;2011年Z1期
10 孟祥福;严丽;马宗民;张富;王星;;基于语义相似度的数据库自适应查询松弛方法[J];计算机学报;2011年05期
11 韩仙玉;姜瑛;;针对构件测试本体的语义相似度计算方法[J];计算机应用;2011年06期
12 张玉芳;徐安龙;;改进的基因术语间语义相似度计算方法[J];计算机应用;2012年05期
13 韩欣;樊永生;马春森;杨和平;;基于树状结构的语义相似度计算方法分析[J];微电子学与计算机;2012年05期
14 吴旭东;成卫青;黄卫东;;改进的主客观结合的词语语义相似度算法[J];计算机技术与发展;2012年09期
15 熊芳;黄宏斌;黄玉成;冯嵩;胡建中;;一种基于语义相似度的信息资源语义聚类算法[J];计算机工程与科学;2012年11期
16 李文庆;谢红薇;;基于医疗本体的语义相似度评估方法[J];计算机工程与设计;2013年04期
17 徐德智;C.Onyango;王怀民;;上位本体中语义相似度的计算及其实现[J];计算技术与自动化;2007年02期
18 俞扬信;;基于语义相似度的信息检索研究[J];情报杂志;2009年09期
19 赵永金;郑洪源;丁秋林;;一种基于本体的语义相似度算法研究[J];计算机应用;2009年11期
20 吴飞珍;马文丽;王旺迪;陈启龙;郑文岭;;一种新的基因注释语义相似度计算方法[J];生物信息学;2010年01期
中国重要会议论文全文数据库 前10条
1 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
3 冯新元;魏建国;路文焕;党建武;;引入领域知识的基于《知网》词语语义相似度计算[A];第十二届全国人机语音通讯学术会议(NCMMSC'2013)论文集[C];2013年
4 章成志;;词语的语义相似度计算及其应用研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 刘寒磊;关毅;徐永东;;多文档文摘中基于语义相似度的最大边缘相关技术研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 石静;邱立坤;王菲;吴云芳;;相似词获取的集成方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 陈明;鹿旸;;基于语义相似度的P2P平衡路由网络[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
8 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
9 夏虹;李增智;陈彦萍;;基于概念格的语义Web服务匹配研究[A];2006年全国通信软件学术会议论文集[C];2006年
10 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前4条
1 刘宏哲;文本语义相似度计算方法研究[D];北京交通大学;2012年
2 王俊华;基于不确定性理论的单词语义相似度度量[D];吉林大学;2014年
3 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
4 魏军英;基于WEB服务的中小企业制造资源共享关键技术研究[D];山东科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 赵永金;移动Agent及语义相似度计算在智能决策中的研究与应用[D];南京航空航天大学;2010年
2 胡艳波;基于区间直觉模糊集的语义相似度研究[D];曲阜师范大学;2012年
3 李昊迪;语义相似度的混合计算方法[D];哈尔滨工业大学;2013年
4 李清;一体化医学语言系统的语义相似度及推理研究[D];哈尔滨工业大学;2012年
5 吴柏华;基因间语义相似度计算方法研究及应用[D];重庆大学;2014年
6 杨春龙;基于概念语义相似度计算模型的信息检索研究与实现[D];华东理工大学;2013年
7 姚俭平;基于语义相似度的本体实例与概念匹配研究[D];杭州电子科技大学;2013年
8 李文庆;基于医学领域本体的语义相似度算法研究[D];太原理工大学;2013年
9 白晓秋;基于本体的概念语义相似度和相关度研究与应用[D];山东师范大学;2014年
10 金希茜;基于语义相似度的中文文本相似度算法研究[D];浙江工业大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978