收藏本站
《安徽工业大学学报(自然科学版)》 2008年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于知网语义相关度计算的词义消歧方法

王广正  王喜凤  
【摘要】:歧义字段处理一直是中文信息处理领域中最关键也是最困难的问题之一,至今该问题仍没有得到完全而有效的解决,使得以此为基础的多个应用领域都难以取得突破性进展。传统的消歧方法--规则消歧和统计消歧都有不可避免的缺点:规则消歧存在规则的完备性与合理性问题,统计消歧则只取大概率事件而忽视小概率事件。在研究了知网表达汉语知识的基础上,改进了基于知网语义相关度的计算模型,并应用于汉语的歧义字段处理中。经大量例句作实验,以句子为单位的切分正确率可达到97.1%,验证了该消歧方法的有效性。

【引证文献】
中国期刊全文数据库 前3条
1 缪建明;张全;;一种基于概念关联式的词义消岐方法[J];计算机科学;2010年01期
2 张振幸;李金厚;;一种基于知网的语义相关度计算方法[J];洛阳师范学院学报;2010年02期
3 王贤川;曾敏;王小宁;朱雪波;李洪波;刘巧;;一种改进的基于语义的词义消歧方法[J];计算机应用与软件;2012年02期
中国博士学位论文全文数据库 前1条
1 钟茂生;基于内容相关度计算的文本结构分析方法研究[D];上海交通大学;2010年
中国硕士学位论文全文数据库 前4条
1 王贤川;基于知网的文本分类算法研究及应用[D];江苏大学;2009年
2 王金锦;面向隐喻计算的实体概念知识库构建方法研究[D];厦门大学;2009年
3 都菁;基于论坛语料的未登录词自动识别新方法[D];西南大学;2010年
4 徐赟;基于知网和贝叶斯模型的词义消岐技术的研究[D];南京理工大学;2010年
【参考文献】
中国期刊全文数据库 前5条
1 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
2 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
3 张运良;张全;;基于HNC理论的语义相关度计算方法[J];计算机工程与应用;2005年34期
4 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
5 孙茂松,左正平,邹嘉彦;高频最大交集型歧义切分字段在汉语自动分词中的作用[J];中文信息学报;1999年01期
【共引文献】
中国期刊全文数据库 前10条
1 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
2 吴娜炯;;格语法在主观题自动阅卷中的应用[J];办公自动化;2010年08期
3 李国和;刘光胜;吴卫江;孙红军;唐先明;韩宝东;;基于最大匹配和歧义检测的中文分词粗分方法[J];北京信息科技大学学报(自然科学版);2010年S2期
4 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
5 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
6 陈康;樊孝忠;刘杰;贾可亮;;基于问句语义表征的中文问句相似度计算方法[J];北京理工大学学报;2007年12期
7 王常亮;闫利华;吴曦德;;基于XML的智能答疑系统研究[J];赤峰学院学报(自然科学版);2008年09期
8 陈晓明;梁雄友;;一种实用的PCFG多阶段全局寻优句法分析算法[J];长春理工大学学报(自然科学版);2010年02期
9 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
10 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
中国重要会议论文全文数据库 前10条
1 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
2 李月雷;师瑞峰;林丽冰;周一民;;汉语语句语义相似度的计算方法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
3 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 Chunyu Kit;;An Example-based Study on Chinese Word Segmentation Using Critical Fragments[A];Proceedings of the Conference First International Joint Conference on Natural Language Processing[C];2004年
8 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 郭慧志;王强军;刘华;张普;;大规模动态流通语料库的构建[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 张蕾;概念结构及其应用[D];西北工业大学;2001年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
5 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
6 余卫宇;几种图像结构语义模型和图像[D];华南理工大学;2005年
7 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
8 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
9 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
10 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
2 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
3 丛肖为;敏感信息监管系统的设计与实现[D];华东师范大学;2010年
4 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
5 巫昌凯;企业知识库系统中复杂查询系统的设计与实现[D];华南理工大学;2010年
6 孙萍;面向事件的多文档自动文摘研究[D];江苏大学;2010年
7 徐德玉;中文文档内容相似度检测方法研究[D];长春工业大学;2010年
8 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
9 樊春雷;基于语义分析的糖尿病健康教育系统研究与实现[D];华东理工大学;2011年
10 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
【同被引文献】
中国期刊全文数据库 前10条
1 张德鑫;“水至清则无鱼”——我的新生词语规范观[J];北京大学学报(哲学社会科学版);2000年05期
2 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
3 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期
4 朱靖波,陈文亮;基于领域知识的文本分类[J];东北大学学报;2005年08期
5 谭振华;程维;常桂然;高晓兴;;基于词汇相关度模型的个性化信息检索算法[J];东北大学学报(自然科学版);2008年04期
6 吴云芳;;词义消歧研究:资源、方法与评测[J];当代语言学;2009年02期
7 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
8 甘灿;孙星明;刘玉玲;向凌云;;一种改进的基于同义词替换的中文文本信息隐藏方法[J];东南大学学报(自然科学版);2007年S1期
9 郭玉琴;袁方;刘海博;;基于模糊分类规则树的文本分类(英文)[J];Journal of Southeast University(English Edition);2008年03期
10 张志琴;图式知识与语篇衔接关系的建立[J];山西大学师范学院学报;2002年01期
中国重要会议论文全文数据库 前2条
1 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
2 朱海军;张桂平;蔡东风;王炜华;;知网在文本分割算法中的应用[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前2条
1 凌坚;新闻视频主题识别与跟踪的研究[D];浙江大学;2007年
2 乐明;汉语财经评论的修辞结构标注及篇章研究[D];中国传媒大学;2006年
中国硕士学位论文全文数据库 前4条
1 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
2 张玲;词汇搭配的语义分析[D];武汉理工大学;2006年
3 闫蓉;基于语义的汉语词义消歧方法研究[D];西北大学;2006年
4 马楠;现代汉语句段内的语义联系[D];黑龙江大学;2008年
【二级引证文献】
中国期刊全文数据库 前2条
1 谭敏;;基于UML的公安情报自动分类系统设计[J];价值工程;2011年11期
2 谭敏;范强;;基于SVM的公安情报自动分类系统模型设计[J];网络安全技术与应用;2012年07期
中国硕士学位论文全文数据库 前6条
1 井志强;基于扩展的VSM中文文本分类方法[D];哈尔滨工程大学;2010年
2 闻玉彪;一种基于组合模型的中文未登录词词性猜测方法[D];云南大学;2011年
3 邓飞;基于本体的查询扩展研究[D];辽宁科技大学;2011年
4 刘金克;基于机器学习算法的隐喻识别研究[D];南京师范大学;2011年
5 符会涛;基于互信息的文本自动分类特征选择方法研究[D];新疆大学;2011年
6 卢志翔;全文检索系统研究[D];广西大学;2011年
【二级参考文献】
中国期刊全文数据库 前2条
1 李素建;基于语义计算的语句相关度研究[J];计算机工程与应用;2002年07期
2 刘开瑛;现代汉语自动分词评测技术研究[J];语言文字应用;1997年01期
【相似文献】
中国期刊全文数据库 前10条
1 任铭;;互联网舆情热点分析统计方法研究[J];科技促进发展(应用版);2010年06期
2 邹海;郇秀花;;基于认知广度和深度的个性化信息检索模型[J];微型机与应用;2011年13期
3 张永兴;孙四明;张峰;;基于本体的信息检索系统研究[J];微计算机信息;2011年07期
4 刘鹏远;赵铁军;;基于挖掘Web双语词汇关联度的无指导译文消歧[J];高技术通讯;2010年04期
5 王晋;孙涌;王璁玮;;基于领域本体的文本相似度算法[J];苏州大学学报(工科版);2011年03期
6 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
7 于兴艳;孔真;;浅析基于web的跨语言信息检索之现状[J];信息通信;2011年04期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 田萱;杜小勇;李海华;;一种基于语义关系计算领域本体中概念间语义相关度的方法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 张仰森;黄改娟;苏文杰;;基于隐最大熵原理的汉语词义消歧方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 孙茂松;;汉语自动分词研究及其应用:回顾与展望[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
5 王红玲;吕强;徐瑞;;一种基于知网的中文语义相关度计算模型[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 曲维光;;解决汉语自动分词的方法选择[A];第一届学生计算语言学研讨会论文集[C];2002年
8 余晓峰;刘鹏远;赵铁军;;一种基于《知网》的汉语词语词义消歧方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
10 丁江伟;刘挺;卢志茂;李生;;隐马尔可夫模型和贝叶斯模型词义消歧对比研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 车超;知识自动获取的词义消歧方法[D];大连理工大学;2010年
2 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
3 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
4 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
5 王菁华;文本中知识的获取[D];北京邮电大学;2008年
6 田萱;基于上下文的信息检索关键技术研究[D];中国人民大学;2007年
7 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
8 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
9 王瑞琴;基于语义处理技术的信息检索模型研究[D];浙江大学;2009年
10 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 汪祥;基于中文维基百科的语义相关度计算的研究与实现[D];国防科学技术大学;2011年
2 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
3 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
4 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
5 肖江涛;基于本体的语义相关度算法研究[D];国防科学技术大学;2010年
6 邓宾;中文词义消岐研究[D];昆明理工大学;2009年
7 程晓静;自然语言处理在药物专利检索系统中的应用[D];大连理工大学;2004年
8 张功亮;基于领域本体的Web语义信息检索研究[D];广西师范大学;2011年
9 陈浩;基于二阶上下文的无导词义消歧研究[D];华中师范大学;2005年
10 秦少康;英语词汇歧义及英汉机器翻译中词义消歧上下限研究[D];厦门大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026