收藏本站
《计算机科学》 2012年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于SVM的中文名词短语指代消解研究

高俊伟  孔芳  朱巧明  李培峰  
【摘要】:指代消解是自然语言处理领域中要研究的关键问题之一。在自然语言中,为了使语言简明,减少冗余,往往对同一意思的单词、句子或某一事件用不同的单词来代替。相对于人而言,计算机理解这些指代现象就比较困难,因此近年来关于指代消解的研究越来越多。由于中文指代消解研究起步较晚,因此关于中文名词短语指代消解的研究还比较少,大多研究是关于英文指代消解的。给出了一个基于SVM的中文名词短语指代消解平台并详细介绍了整个实现过程,语料库采用OntoNotes 3.0的中文新闻语料。利用3种评测算法对系统性能进行了评测,结果表明本系统是一个比较好的中文指代消解平台。
【作者单位】苏州大学计算机科学与技术学院;江苏省计算机信息处理技术重点实验室;
【关键词】指代消解 名词短语 自然语言处理 SVM
【基金】:国家自然科学基金(90920004,60970056,61070123,61003153) 江苏省高校自然科学重大基础研究项目(08KJA520002)资助
【分类号】:TP391.1
【正文快照】:
1概述指代现象是自然语言领域中广泛存在的现象,它是指两个实体是否指向现实世界的同一实体;这对简化语言,减少冗余有很大的作用,使自然语言看起来更加紧凑。指代消解在篇章理解、人机对话、机器翻译、信息抽取、文本摘要等领域中的相关研究也越来越多。指代消解已经成为自然

【参考文献】
中国期刊全文数据库 前5条
1 孔芳;朱巧明;周国栋;钱培德;;基于中心理论的指代消解研究[J];计算机科学;2009年06期
2 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
3 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
4 周俊生;黄书剑;陈家骏;曲维光;;一种基于图划分的无监督汉语指代消解算法[J];中文信息学报;2007年02期
5 王厚峰,梅铮;鲁棒性的汉语人称代词消解[J];软件学报;2005年05期
【共引文献】
中国期刊全文数据库 前10条
1 李世奇;赵铁军;陈晨;刘鹏远;;基于ART网络的无指导中文共指消解方法[J];高技术通讯;2009年09期
2 杨宁;;汉语零形回指:基于话题的分析[J];华南师范大学学报(社会科学版);2010年06期
3 孔芳;朱巧明;周国栋;;中英文指代消解中待消解项识别的研究[J];计算机研究与发展;2012年05期
4 钟丹;朱倩;李梅;程显毅;;人称名词短语单复数信息和最大熵模型的指代消解[J];江南大学学报(自然科学版);2009年06期
5 李林欣;;平南大新话的代词及其用法[J];剑南文学(经典教苑);2012年05期
6 谭魏璇;孔芳;王海东;周国栋;;使用树核函数进行中文代词消解的研究[J];计算机工程与应用;2010年24期
7 李元龙;周俊生;陈家骏;;一种基于关联聚类的汉语共指消解方法[J];计算机科学;2007年12期
8 刘未鹏;周俊生;黄书剑;陈家骏;;基于有监督关联聚类的中文共指消解[J];计算机科学;2009年09期
9 李凡;刘启和;李洪伟;;基于Fuzzy Rough集模型的汉语人称代词消解[J];计算机科学;2010年01期
10 张宁;孔芳;李培峰;朱巧明;;基于机器学习方法的事件指代消歧研究[J];计算机科学;2012年05期
中国重要会议论文全文数据库 前10条
1 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
3 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 杨佳;;基于语料分析的“这/那+NP”的指代消解算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 郎君;秦兵;刘挺;李生;;中国人名性别自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
7 史晓东;陈毅东;;基于语篇的机器翻译前瞻[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 宋巍;秦兵;郎君;刘挺;;句法与词义相结合的中文代词消解[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 谢永康;周雅倩;黄萱菁;;一种基于谱聚类的共指消解方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前10条
1 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
2 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
3 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
4 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
5 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
6 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
7 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
8 李凡;Rough集理论及其应用中若干问题的研究[D];电子科技大学;2008年
9 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
10 杨宁;汉语零形回指消解的心理语言学研究[D];广东外语外贸大学;2008年
中国硕士学位论文全文数据库 前10条
1 孙萍;面向事件的多文档自动文摘研究[D];江苏大学;2010年
2 刘龙;音乐领域全局实体关系抽取研究[D];哈尔滨工业大学;2010年
3 魏征;交互式问答系统中的省略恢复研究[D];哈尔滨工业大学;2010年
4 张牧宇;基于实例动态泛化的共指消解及应用[D];哈尔滨工业大学;2011年
5 邹永强;新闻网页中人物实体关系提取技术研究[D];国防科学技术大学;2011年
6 王敏;基于多代理策略的中文实体关系抽取[D];大连理工大学;2011年
7 曹军;汉语第三人称代词消解方法研究[D];湘潭大学;2002年
8 张占英;关于数据库汉语查询语句中查询信息的研究[D];河南大学;2004年
9 吴雪军;面向信息抽取的命名实体识别与模板获取技术研究[D];东北大学;2005年
10 范重庆;基于动态知识库的高考咨询问答系统研究[D];华中师范大学;2006年
【二级参考文献】
中国期刊全文数据库 前10条
1 钱伟,郭以昆,周雅倩,吴立德;基于最大熵模型的英文名词短语指代消解[J];计算机研究与发展;2003年09期
2 王厚峰;;句类中E块的作用及其判定策略[J];计算机科学;2000年05期
3 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
4 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
5 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
6 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
7 王厚峰,梅铮;鲁棒性的汉语人称代词消解[J];软件学报;2005年05期
8 许敏,王能忠,马彦华;汉语中指代问题的研究及讨论[J];西南师范大学学报(自然科学版);1999年06期
9 刘志文,郝惠宁,肖友芙,黄曾阳;自然语言语句的HNC表示[J];语言文字应用;1998年02期
10 黄曾阳;HNC理论与自然语言语句的理解[J];中国基础科学;1999年Z1期
【相似文献】
中国期刊全文数据库 前10条
1 胡乃全;孔芳;王海东;周国栋;朱巧明;;基于最大熵模型的中文指代消解系统实现[J];计算机应用研究;2009年08期
2 杨凯;;浅谈指代消解[J];硅谷;2008年24期
3 杜永萍;何明;;基于多策略的单文档问答式信息检索技术[J];计算机科学;2009年07期
4 孔芳;周国栋;朱巧明;钱培德;;指代消解综述[J];计算机工程;2010年08期
5 王灿辉;张敏;马少平;;自然语言处理在信息检索中的应用综述[J];中文信息学报;2007年02期
6 伍守芹;李晓昀;;信息抽取技术研究与探讨[J];福建电脑;2010年04期
7 麦范金;李东普;甘国庆;;基于指代消解的自动文摘方法研究[J];情报理论与实践;2010年10期
8 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
9 詹卫东;;自然语言的自动分析与生成简介[J];术语标准化与信息技术;2010年04期
10 闫琪,张志伟,宁洪;用户搜索请求中限定成分的识别及提取[J];计算机工程与科学;2000年03期
中国重要会议论文全文数据库 前10条
1 郎君;刘挺;张会鹏;李生;;LTP:语言技术平台[A];第三届学生计算语言学研讨会论文集[C];2006年
2 郎君;刘挺;李生;张会鹏;;基于XML的开放式语言技术平台:LTP[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 杜永萍;黄萱菁;;开放领域的QA系统结构及性能分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
7 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
8 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
10 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
2 ;开天辟地第一回[N];计算机世界;2002年
3 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
4 运迪;未来电脑什么样[N];山西科技报;2000年
5 袁晓静 高振平 鲁元魁;编写高质量的PB应用程序(上)[N];计算机世界;2002年
6 Chris Kanaracus沈建苗 编译;企业搜索的未来[N];计算机世界;2008年
7 ;未来十年展望之体验技术[N];中国计算机报;2010年
8 ;搜索引擎将引入人工智能技术[N];人民邮电;2006年
9 ;BI和文本分析的强强联手[N];网络世界;2007年
10 郭莹;全文检索市场空间大[N];中国计算机报;2006年
中国博士学位论文全文数据库 前10条
1 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
2 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
3 孔芳;指代消解关键问题研究[D];苏州大学;2009年
4 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
5 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
6 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
7 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 方宁;基于认知的文本语境生成和度量研究[D];上海大学;2009年
10 王燚;基于场景化知识表示的自然语言处理及其在自动文本校对中的应用[D];西南交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 张楠;限定领域内动词短语和名词短语的语义分析[D];天津师范大学;2008年
2 陈九昌;指代消解中待消解项识别研究[D];苏州大学;2010年
3 黄李伟;中文零指代消解研究[D];苏州大学;2010年
4 陆长生;中文跨文档指代消解的研究与实现[D];苏州大学;2010年
5 倪吉;中文人名跨文档指代消解研究[D];苏州大学;2011年
6 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
7 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
8 丁卓冶;中文命名实体识别的研究[D];大连理工大学;2008年
9 孙继明;基于知网的汉语词义消歧研究[D];国防科学技术大学;2007年
10 孙广庆;基于语义范畴扩展的词义消歧的研究[D];哈尔滨工程大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026