收藏本站
《计算机工程》 2007年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

汉语词语语义相似度计算研究

夏天  
【摘要】:汉语词语的语义相似度计算是中文信息处理中的一个关键问题。该文提出了一种基于知网、面向语义、可扩展的相似度计算新方法,该方法从信息论的角度出发,定义了知网义原间的相似度计算公式,通过对未登录词进行概念切分和语义自动生成,解决了未登录词无法参与语义计算的难题,实现了任意词语在语义层面上的相似度计算。针对同义词词林的实验结果表明,该方法的准确率比现有方法高出近15个百分点。

【引证文献】
中国期刊全文数据库 前10条
1 李园白;崔蒙;杨阳;朱晓博;;证候相似性比较方法研究[J];中华中医药杂志;2012年02期
2 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
3 李剑;李金厚;;一种基于知网的概念相似度计算方法[J];工业控制计算机;2011年04期
4 张仰森;钟鼎;;基于SKCC与统计相结合的词语相似度计算方法[J];北京信息科技大学学报(自然科学版);2012年06期
5 傅鹤岗;徐晨霞;;基于知网的元搜索引擎多关键词检索研究[J];计算机工程与应用;2008年22期
6 王堂;曹宝香;芦效峰;杨义先;钮心忻;;基于汉字字段的关系数据库数字水印研究[J];计算机科学;2011年12期
7 葛斌;李芳芳;郭丝路;汤大权;;基于知网的词汇语义相似度计算方法研究[J];计算机应用研究;2010年09期
8 刘兴林;陈建超;马千里;;基于互联网的词汇语义知识库构建框架研究[J];计算机与现代化;2010年10期
9 张瑞霞;杨国增;吴慧欣;;基于《知网》的汉语未登录词语义相似度计算[J];中文信息学报;2012年01期
10 王涛;陈红英;;基于贝叶斯网络的概念间语义相似度计算[J];计算机与现代化;2012年09期
中国重要会议论文全文数据库 前2条
1 崔磊;陈清才;郭鸿志;王晓龙;;HowNet与维基百科知识融合中的义类属性自动构建方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 张冠元;林健;;一种针对餐馆评论的文本倾向性分析算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前8条
1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
2 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
3 李园白;中医医案文献特殊性评价方法研究[D];中国中医科学院;2010年
4 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
5 刘紫玉;多专业领域本体的构建及语义检索研究[D];北京交通大学;2010年
6 钟茂生;基于内容相关度计算的文本结构分析方法研究[D];上海交通大学;2010年
7 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
8 王静;基于本体的中医文献诊疗信息的智能检索示范研究[D];中国中医科学院;2012年
中国硕士学位论文全文数据库 前10条
1 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
2 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
3 吴波;改进的编辑距离算法的研究及其在电子政务中的应用[D];电子科技大学;2011年
4 周倩;基于多值词汇语义相似度的SME模型改进[D];河南大学;2011年
5 吴全娥;汉语句子相似度计算及其在自动问答系统中的应用[D];西南大学;2011年
6 张红春;中文维基百科的结构化信息抽取及词语相关度计算[D];华中师范大学;2011年
7 李剑;基于分块的句子语义相似度研究[D];安徽工业大学;2011年
8 何亚;主观题辅助评分方法的研究与应用[D];中南大学;2010年
9 郑小波;基于语义的主题搜索引擎研究[D];安徽大学;2011年
10 唐凌志;基于语义理解的论文相似度研究[D];湘潭大学;2011年
【参考文献】
中国期刊全文数据库 前4条
1 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
2 刘亚军,徐易;一种基于加权语义相似度模型的自动问答系统[J];东南大学学报(自然科学版);2004年05期
3 李有梅;基于词义的关键词抽取方法研究[J];情报理论与实践;2000年02期
4 朱毅华,侯汉清,沙印亭;计算机识别汉语同义词的两种算法比较和测评[J];中国图书馆学报;2002年04期
【共引文献】
中国期刊全文数据库 前10条
1 陈康;樊孝忠;刘杰;贾可亮;;基于问句语义表征的中文问句相似度计算方法[J];北京理工大学学报;2007年12期
2 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期
3 杨松;楼新远;;基于向量空间模型附加词义特征的句子相似度研究[J];成都信息工程学院学报;2012年03期
4 陈蔓萍;刘钰峰;;基于ALICE的个性化英语学习同伴[J];中国远程教育;2006年03期
5 文必龙;肖波;陈新荣;;石油勘探开发数据元管理技术[J];大庆石油学院学报;2012年01期
6 侯汉清,薛鹏军;基于知识库的网页自动标引和自动分类系统的设计[J];大学图书馆学报;2004年01期
7 林立宇;;MSN查号机器人的研究与应用[J];广东通信技术;2007年09期
8 刘杰;樊孝忠;王涛;;基于本体的受限领域问答系统研究[J];广西师范大学学报(自然科学版);2009年01期
9 李剑;李金厚;;一种基于知网的概念相似度计算方法[J];工业控制计算机;2011年04期
10 刘亚军,赵赟;基于本体和转移网络的网络教育自动答疑系统[J];哈尔滨工业大学学报;2004年12期
中国重要会议论文全文数据库 前2条
1 张庆国;章成志;薛德军;张君玉;;基于K最近邻的隐含主题自动抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 吴继媛;孙淳;侯敏;;面向传媒语言语料库的关键词自动抽取研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前6条
1 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
2 耿焕同;范例推理与互联网文本信息处理研究[D];中国科学技术大学;2006年
3 梅翔;语义检索中若干关键问题的研究[D];北京邮电大学;2007年
4 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
5 黄涛;知识服务的语义匹配机制研究[D];华中师范大学;2007年
6 王菁华;文本中知识的获取[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前10条
1 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
2 赵全;基于半监督学习的中文问句分类研究[D];昆明理工大学;2010年
3 王凤林;受限域问答式自然语言数据库查询研究[D];昆明理工大学;2010年
4 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
5 吴波;改进的编辑距离算法的研究及其在电子政务中的应用[D];电子科技大学;2011年
6 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
7 蔡尚辉;范例推理在智能车辆监控数据处理系统中的应用[D];河北科技大学;2011年
8 宋宇轩;基于搜索日志和点击日志的同义词挖掘的研究和实现[D];北京交通大学;2011年
9 梅筱;视频特征及其描述词汇的对齐研究[D];北京邮电大学;2011年
10 翟姗姗;基于用户兴趣聚类的电子政务信息资源整合研究[D];华中师范大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 许小平;秩和比法在医院管理中的应用[J];安徽卫生职业技术学院学报;2004年05期
2 宋作艳;;字族化与汉语未登录词的自动提取[J];北京大学学报(哲学社会科学版);2007年02期
3 龚书;瞿有利;田盛丰;;基于语义的自动文摘研究综述[J];北京交通大学学报;2009年05期
4 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
5 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
6 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
7 罗智勇;宋柔;;基于多特征的自适应新词识别[J];北京工业大学学报;2007年07期
8 夏天,樊孝忠,刘林,骆正华;基于ALICE的汉语自然语言接口[J];北京理工大学学报;2004年10期
9 骆正华,樊孝忠,刘林,龚永罡;基于E-Chunk的问句实例分析系统[J];北京理工大学学报;2005年01期
10 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
中国重要会议论文全文数据库 前8条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
2 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 颜伟;荀恩东;;基于WordNet的英语词语相似度计算[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 余超;蔡东风;张桂平;;词汇语义相似度计算中相关技术的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
7 梅雪;程学旗;郭岩;张刚;丁国栋;;一种全自动生成网页信息抽取Wrapper的方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 郑晓东;陈亮;常宝宝;;一种基于树核的汉语句法分析多重结果重排序技术[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前1条
1 洪小文;[N];计算机世界;2005年
中国博士学位论文全文数据库 前10条
1 张智雄;Internet科技信息资源门户网站(STIP)系统的实践研究[D];中国科学院文献情报中心;2000年
2 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
3 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
4 陈娟;高技术企业知识体系构造与管理研究[D];复旦大学;2004年
5 倪益华;基于本体的制造企业知识集成技术的研究[D];浙江大学;2005年
6 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
7 郜庆路;分布式自治制造系统中协调机制的研究与仿真[D];华中科技大学;2005年
8 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
9 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
10 杨梅;现代汉语合成词构词研究[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 刘金克;基于机器学习算法的隐喻识别研究[D];南京师范大学;2011年
2 孙卫华;以建构主义为指导的计算机辅助教学软件的设计[D];河北大学;2000年
3 查贵庭;经济新闻自动标引系统的研究[D];南京农业大学;2000年
4 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
5 冯廷勇;对类比推理中映射过程的实验研究[D];西南师范大学;2002年
6 谭义红;关联规则挖掘及其在概念检索中的应用研究[D];湖南大学;2003年
7 杨宗奎;基于综合评价方法的软件质量评价系统研究[D];西安电子科技大学;2004年
8 张滨;中文文档分类技术研究[D];武汉大学;2004年
9 张彦举;系统评价方法的比较研究[D];河海大学;2005年
10 王媛;多agent生产调度系统的设计与实现[D];大连理工大学;2005年
【二级引证文献】
中国期刊全文数据库 前10条
1 孙喜来;王欣;葛昂;郑家民;邓宏斌;;面向相似度的多维异构数据比对模型研究[J];信息安全与技术;2011年09期
2 杨石;邹国奇;杨作为;;一种扩展功能可选取的文本检索系统[J];大众科技;2011年10期
3 曹立勇;郑诚;;基于知网的语义相似度的改进算法[J];电子技术;2010年05期
4 李龙;李芝棠;涂浩;史春永;;一种分布式微博数据采集平台的设计与实现[J];广西大学学报(自然科学版);2011年S1期
5 李剑;李金厚;;一种基于知网的概念相似度计算方法[J];工业控制计算机;2011年04期
6 王俊超;刘晨帆;徐明世;纪山;兰伟;;语义相似性度量技术在地名匹配研究中的应用[J];辽宁工程技术大学学报(自然科学版);2012年06期
7 蒋卓人;陈燕;王永清;;基于数据元语义树的概念语义相关度算法研究[J];大连海事大学学报;2012年04期
8 朱旺南;李玲;;客户服务系统研究现状与发展趋势[J];电脑知识与技术;2012年35期
9 张仰森;钟鼎;;基于SKCC与统计相结合的词语相似度计算方法[J];北京信息科技大学学报(自然科学版);2012年06期
10 齐玉东;闫晓斌;谢晓方;;基于LISA理论的概念模型相似度计算[J];计算机工程与应用;2012年03期
中国博士学位论文全文数据库 前10条
1 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
2 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
3 杨阳;中药提取工艺文献知识组织方法研究[D];中国中医科学院;2011年
4 李勤超;基于本体的地理信息语义转换模型与方法研究[D];解放军信息工程大学;2011年
5 刘丹;大成组技术中的若干关键技术研究[D];浙江大学;2010年
6 丁艳辉;面向Web数据集成的数据抽取问题研究[D];山东大学;2010年
7 于娟;基于文本的领域本体学习方法及其应用研究[D];大连理工大学;2010年
8 钟美;基于Web的空间本体构建方法研究[D];武汉大学;2010年
9 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
10 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
2 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
3 李晓菲;面向客户的电子目录本体自学习理论与方法研究[D];武汉理工大学;2010年
4 王冬娇;改进的语句相似度算法在问答系统中的应用研究[D];大连交通大学;2010年
5 魏春良;本体的构建方法与应用研究[D];电子科技大学;2011年
6 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
7 薛慧芳;句子相似度计算理论及应用研究[D];西北大学;2011年
8 相鹏飞;IT领域知识服务平台的设计与实现[D];西北大学;2011年
9 周倩;基于多值词汇语义相似度的SME模型改进[D];河南大学;2011年
10 孙胜平;中文微博客热点话题检测与跟踪技术研究[D];北京交通大学;2011年
【二级参考文献】
中国期刊全文数据库 前4条
1 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
2 夏天,樊孝忠,刘林;ALICE机理分析与应用研究[J];计算机应用;2003年09期
3 侯汉清;新闻信息数据库后控词表的设计和编制[J];江苏图书馆学报;2000年02期
4 王源,吴晓滨,涂从文,刘滨,章元峰,王金娥;后控规范的计算机处理[J];现代图书情报技术;1993年02期
中国硕士学位论文全文数据库 前2条
1 查贵庭;经济新闻自动标引系统的研究[D];南京农业大学;2000年
2 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
【相似文献】
中国期刊全文数据库 前10条
1 曹立勇;郑诚;;基于知网的语义相似度的改进算法[J];电子技术;2010年05期
2 夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期
3 张磊;高雪霞;;基于匈牙利算法的语义相似度分析在信息安全泄密检查中的应用[J];新乡学院学报(自然科学版);2010年06期
4 傅鹤岗;徐晨霞;;基于知网的元搜索引擎多关键词检索研究[J];计算机工程与应用;2008年22期
5 程莉,卢正鼎,文坤梅,李娟;基于语义的模糊匹配探索与应用[J];华中科技大学学报(自然科学版);2003年02期
6 廖剑;冷静;李艳燕;黄荣怀;;知网的形式概念分析及概念相似度研究[J];计算机应用研究;2007年11期
7 王小林;王义;;改进的基于知网的词语相似度算法[J];计算机应用;2011年11期
8 丁振国;陈海霞;;一种基于知网的主观题阅卷算法[J];微电子学与计算机;2008年05期
9 周粉;夏幼明;;一种改进的基于知网的语义相似度计算方法[J];云南大学学报(自然科学版);2008年S2期
10 李杰;曹谢东;余飞;;基于语义相似度计算的词汇语义自动分类系统[J];计算机仿真;2008年08期
中国重要会议论文全文数据库 前10条
1 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 王智超;季铎;蔡东风;张桂平;;文本聚类中基于知网的特征抽取方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 杨晓峰;李堂秋;洪青阳;;汉英机器翻译系统中的一种词义排歧方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 王红玲;吕强;徐瑞;;一种基于知网的中文语义相关度计算模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 张亮;尹存燕;陈家骏;;基于语义树的中文词语相似度计算与分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 邓辉;林柏钢;;一种基于《知网》的敏感信息预测技术[A];第十届中国科协年会论文集(三)[C];2008年
9 白宇;于水;叶娜;蔡东风;任晓娜;;一种基于语境的词语相似度计算方法[A];第五届全国信息检索学术会议论文集[C];2009年
10 廖光忠;黄泽鑫;;基于HowNet语义算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
中国重要报纸全文数据库 前10条
1 记者 陈磊;中国知网率先推出优先数字出版[N];科技日报;2010年
2 见习记者 廖小珊;中国知网推出优先数字出版 读者可多种数字渠道获取[N];中国新闻出版报;2010年
3 本报记者 杨杨;投资、创业两不误:李童的“新孩子”恒知网[N];21世纪经济报道;2011年
4 记者 王秀萍;“中国知网”集约化印刷华北基地在并建成[N];山西经济日报;2010年
5 程晓龙;中国知网联姻施普林格[N];中国新闻出版报;2008年
6 陈;思科用无线感知网络[N];中国计算机报;2003年
7 李大庆;中国知网与施普林格全面合作[N];科技日报;2008年
8 路华;中华行知网(www.sotrip.com)文化与旅游的契合[N];中国旅游报;2000年
9 高向东;千家数字图书馆对接“中国知网”数字出版平台[N];山西日报;2007年
10 计亚男;中国知网数据库携手施普林格[N];光明日报;2008年
中国博士学位论文全文数据库 前10条
1 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
2 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
3 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
4 廖光蓉;概念形式表征与语义变化转换研究[D];上海外国语大学;2009年
5 王菁华;文本中知识的获取[D];北京邮电大学;2008年
6 景东升;基于本体的地理空间信息语义表达和服务研究[D];中国科学院研究生院(遥感应用研究所);2005年
7 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
8 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
9 胡伟;面向MEMS产品概念设计的多模式实例检索与评价方法研究[D];华南理工大学;2012年
10 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
中国硕士学位论文全文数据库 前10条
1 李佳;基于知网的中文本体映射研究[D];北京邮电大学;2007年
2 尹本雄;中文搜索引擎中的文档特征提取研究[D];广西师范大学;2004年
3 郭丽;基于上下文的词语相似度计算及其应用[D];沈阳航空工业学院;2009年
4 董萍;基于知网语义关系的中文事件信息抽取研究[D];西安电子科技大学;2010年
5 李海军;基于语义的汉语短语结构歧义研究与实现[D];西北大学;2006年
6 柴晓丽;自动文摘技术的研究与应用[D];长春理工大学;2007年
7 唐琦;基于语义分析的句子相似度计算研究[D];华北电力大学(北京);2009年
8 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
9 张静静;基于知网文本相似度的文摘自动评测方法研究[D];中国石油大学;2011年
10 李剑;基于分块的句子语义相似度研究[D];安徽工业大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026