收藏本站
《兰州工业高等专科学校学报》 2009年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

中文语句相似度计算的方法初探

李伟  
【摘要】:分析了中文自然语言处理中句子相似度的计算方法,介绍了基于向量空间模型的TF-IDF的、基于句子语义和基于句子依存关系的三种句子相似度计算模型,并对它们的计算原理、计算方法进行了分析,给出了他们的优缺点.基于向量空间模型的句子相似度计算模型已经比较成熟,一般情况下能够产生较好的效果.由于TF-IDF方法没有考虑这种语义信息,所以传统的TF-IDF方法具有一定的局限性.而基于句子语义或句子的依存结构来进行相似度计算,能达到更好的效果.
【作者单位】安徽工业大学计算机学院;
【分类号】:TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
2 李彬,刘挺,秦兵,李生;基于语义依存的汉语句子相似度计算[J];计算机应用研究;2003年12期
【共引文献】
中国期刊全文数据库 前10条
1 骆正华,樊孝忠,刘林,龚永罡;基于E-Chunk的问句实例分析系统[J];北京理工大学学报;2005年01期
2 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
3 杨思春;;一种改进的句子相似度计算模型[J];电子科技大学学报;2006年06期
4 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
5 刘亚军,徐易;一种基于加权语义相似度模型的自动问答系统[J];东南大学学报(自然科学版);2004年05期
6 程莉,卢正鼎,文坤梅,李娟;基于语义的模糊匹配探索与应用[J];华中科技大学学报(自然科学版);2003年02期
7 高思丹,袁春风;语句相似度计算在主观题自动批改技术中的初步应用[J];计算机工程与应用;2004年14期
8 王荣波,池哲儒,常宝宝,柏晓静;基于词串粒度及权值的汉语句子相似度衡量[J];计算机工程;2005年13期
9 王常亮;滕至阳;;语句相似度计算在FAQ中的应用[J];计算机时代;2006年02期
10 赖擎;曹力立;;受限领域中文问答系统的中心句识别的研究[J];计算机时代;2006年02期
中国重要会议论文全文数据库 前1条
1 王红玲;吕强;徐瑞;周国栋;;基于知识的语义相关度计算模型(英文)[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 余卫宇;几种图像结构语义模型和图像[D];华南理工大学;2005年
2 谢能付;基于语义Web技术的知识融合和同步方法研究[D];中国科学院研究生院(计算技术研究所);2006年
3 武斌;面向俄文信息处理的机器翻译实验研究[D];中国人民解放军外国语学院;2007年
中国硕士学位论文全文数据库 前10条
1 汤赛丽;常识知识问答系统中知识库构建的研究与设计[D];河南大学;2005年
2 侯丽敏;基于网络的智能答疑系统的研究与实现[D];河南大学;2005年
3 周舫;汉语句子相似度计算方法及其应用的研究[D];河南大学;2005年
4 金珠;基于知网的话题跟踪和倾向性跟踪研究[D];大连理工大学;2005年
5 曾锦麒;语义WEB的知识表示语言及其应用研究[D];中南大学;2004年
6 余刚;基于语义概念的文本特征描述[D];重庆大学;2005年
7 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
8 卢冶;基于概念扩充和综合评价的中文自动文摘研究[D];大连理工大学;2006年
9 张学;EBMT系统中翻译模板的抽取与匹配[D];大连理工大学;2006年
10 陈檀;基于本体的网上答疑系统的设计[D];山东大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 张俐,李晶皎,胡明涵,姚天顺;中文WordNet的研究及实现[J];东北大学学报(自然科学版);2003年04期
2 胡国全,陈家骏,戴新宇,尹存燕;一种基于实例的汉英机器翻译策略[J];计算机工程与设计;2005年04期
3 张亮;冯冲;陈肇雄;黄河燕;;基于语句相似度计算的FAQ自动回复系统设计与实现[J];小型微型计算机系统;2006年04期
4 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
5 赵妍,侯汉清,耿金玉,叶常妍,何群;中文期刊论文自动标引加权设计研究[J];新世纪图书馆;2004年01期
6 郭燕慧,钟义信,马志勇,姚均勇;自动文摘综述[J];情报学报;2002年05期
7 刘挺,吴岩,王开铸;基于信息抽取和文本生成的自动文摘系统设计[J];情报学报;1997年S1期
8 刘挺,王开铸;自动文摘的四种主要方法[J];情报学报;1999年01期
9 余战秋;中文分词技术及其应用初探[J];电脑知识与技术;2004年32期
10 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
中国重要会议论文全文数据库 前1条
1 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国硕士学位论文全文数据库 前1条
1 毛伟;基于统计语言模型的中文自动文本分类系统[D];北京邮电大学;2006年
【二级参考文献】
中国期刊全文数据库 前5条
1 郭艳华,周昌乐;一种汉语语句依存关系网协动生成方法研究[J];杭州电子工业学院学报;2000年04期
2 孙春葵,李蕾,杨晓兰,钟义信;基于知识的文本摘要系统研究与实现[J];计算机研究与发展;2000年07期
3 万敏,罗振声,季姮,高小云;基于概念统计的英文自动文摘研究[J];计算机工程与应用;2002年24期
4 王萌,何婷婷,张伟;基于概念向量空间模型的中文自动文摘系统[J];计算机工程与应用;2005年01期
5 刘海涛;依存语法和机器翻译[J];语言文字应用;1997年03期
【相似文献】
中国期刊全文数据库 前10条
1 顾榕,王小平,曹立明;一种基于潜在语义分析的查询扩展算法[J];计算机工程与应用;2004年18期
2 王惠敏;聂规划;付魁;;领域本体中基于多维特征的语义相似度算法研究[J];情报杂志;2008年10期
3 黄宏斌;刘志忠;张维明;邓苏;马丽丽;;基于层次本体模型(HOM)的语义相似度计算方法[J];系统工程与电子技术;2009年07期
4 吴飞珍;马文丽;王旺迪;陈启龙;郑文岭;;一种新的基因注释语义相似度计算方法[J];生物信息学;2010年01期
5 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
6 徐德智;C.Onyango;王怀民;;上位本体中语义相似度的计算及其实现[J];计算技术与自动化;2007年02期
7 张晓孪;王西锋;;FCA中的概念语义相似度计算[J];现代图书情报技术;2007年03期
8 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
9 史斌;闫健卓;王普;方丽英;;基于本体的概念语义相似度度量[J];计算机工程;2009年19期
10 刘卫;刘金岭;;基于《知网》的词语语义相似度改进及应用[J];福建电脑;2010年05期
中国重要会议论文全文数据库 前10条
1 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
3 刘晓平;沈冠町;;协同讨论观点影响度分析方法及其应用[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
4 刘立;余正涛;王蒙;毛存礼;郭剑毅;;结合词相关特征与流行学习的中文问句分类[A];第六届全国信息检索学术会议论文集[C];2010年
5 刘寒磊;关毅;徐永东;;多文档文摘中基于语义相似度的最大边缘相关技术研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 骆正华;;基于E-Chunk问句实例库问答系统的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
8 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 陈雷明;邹欣;党德玉;;一种基于语义优化非单调推理的方法[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
10 章成志;李斌;;基于混合策略的查询串相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 刘宏哲;文本语义相似度计算方法研究[D];北京交通大学;2012年
2 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
3 周子力;基于WordNet的本体构建及其在安全领域应用关键技术研究[D];华东师范大学;2009年
4 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
5 李宏伟;基于Ontology的地理信息服务研究[D];解放军信息工程大学;2007年
6 王芳;基于本体的广域农业信息服务系统关键技术研究[D];河北农业大学;2012年
7 杨峰;本体映射关键技术研究[D];吉林大学;2011年
8 刘春辰;基于本体的企业搜索优化技术研究[D];吉林大学;2012年
9 孟祥福;Web数据库柔性查询关键技术研究[D];东北大学;2010年
10 朱海平;基于概念图匹配的语义搜索[D];上海交通大学;2006年
中国硕士学位论文全文数据库 前10条
1 郑丽萍;本体映射的研究[D];山东科技大学;2005年
2 常晓环;基于概念图的语义检索方法研究[D];吉林大学;2009年
3 秦鹏;基于WordNet的本体匹配关键技术研究与实现[D];华东师范大学;2010年
4 郭嘉琦;领域本体的构建及其在信息检索中的应用研究[D];北京邮电大学;2007年
5 赵大明;基于本体的专业搜索引擎的研究与设计[D];西北大学;2009年
6 关淞元;本体匹配算法的研究[D];吉林大学;2009年
7 尹睿;基于语义相似度的论文文本聚类算法研究[D];大连理工大学;2009年
8 王曙光;基于蚁群的文本聚类算法的改进研究[D];大连理工大学;2006年
9 宗裕朋;基于本体的中文智能答疑系统研究与实现[D];上海交通大学;2007年
10 罗思明;基于语义相似度的汉语未登录动词语义框架识别[D];北京邮电大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026