收藏本站
《中文信息学报》 2013年03期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

语料对中文名词短语指代消解影响研究

高俊伟  孔芳  朱巧明  李培峰  
【摘要】:指代是自然语言中一种常见的语言现象,对简化语言,减少冗余有很大的作用。指代消解是用计算机找出这些指代现象的一个过程。近几年英文指代消解研究取得了很大的成就,然而,中文指代消解研究目前还较少,一方面是由于中文自然语言处理的研究起步较晚,相关的知识较少,另外一方面就是中文相关的语料库较少,目前已知的仅有ACE2005,OntoNotes等。为了探讨语料库对中文名词短语指代消解的影响,该文实现了一个基于有监督学习方法的中文名词短语指代消解平台和一个基于无监督聚类方法的中文名词短语指代消解平台,在此平台的基础上从语料库的数量和质量两个方面来探讨语料对中文名词短语指代消解的影响。
【作者单位】苏州大学计算机科学与技术学院 江苏省计算机信息处理技术重点实验室;
【基金】:国家自然科学基金资助项目(90920004,60970056,61070123,61003153) 江苏省高校自然科学重大基础研究资助项目(08KJA520002)
【分类号】:TP391.1
【正文快照】:
1引言指代是自然语言中一种常见的语言现象,指在文本中用一个语言成分回指以前提及过的某个语言单位,表现形式有别名、代词、专有名词等。这种指代现象对减少冗余,简化语言,突出主题,使文本上下连贯通俗易懂都有很好的作用。随着人机对话、机器翻译、信息抽取等研究的不断深入

【参考文献】
中国期刊全文数据库 前6条
1 史树敏;黄河燕;刘东升;;自然语言文本共指消解性能评测算法研究[J];计算机科学;2008年09期
2 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
3 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
4 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
5 周俊生;黄书剑;陈家骏;曲维光;;一种基于图划分的无监督汉语指代消解算法[J];中文信息学报;2007年02期
6 王厚峰,梅铮;鲁棒性的汉语人称代词消解[J];软件学报;2005年05期
【共引文献】
中国期刊全文数据库 前10条
1 何甫权;;英语指代与翻译[J];安徽文学(下半月);2008年08期
2 吴敏;;指代消解在普通语言学理论与课程实践上的应用研究[J];大家;2010年11期
3 杨凯;;浅谈指代消解[J];硅谷;2008年24期
4 李世奇;赵铁军;陈晨;刘鹏远;;基于ART网络的无指导中文共指消解方法[J];高技术通讯;2009年09期
5 王红玲;;零形回指优选解析研究[J];重庆交通大学学报(社会科学版);2013年01期
6 黄丹凤;;浅谈中文信息处理跨文本指代消解研究[J];电脑知识与技术;2013年15期
7 杨宁;;汉语零形回指:基于话题的分析[J];华南师范大学学报(社会科学版);2010年06期
8 孔芳;朱巧明;周国栋;;中英文指代消解中待消解项识别的研究[J];计算机研究与发展;2012年05期
9 钟丹;朱倩;李梅;程显毅;;人称名词短语单复数信息和最大熵模型的指代消解[J];江南大学学报(自然科学版);2009年06期
10 李林欣;;平南大新话的代词及其用法[J];剑南文学(经典教苑);2012年05期
中国重要会议论文全文数据库 前10条
1 王治敏;俞士汶;;人称代词和名词的歧义消解研究[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 谭斌;;指代消解的原理和实现方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
3 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 杨佳;;基于语料分析的“这/那+NP”的指代消解算法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 梅铮;王厚峰;;汉语人称代词消解的前端处理[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 郎君;秦兵;刘挺;李生;;中国人名性别自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
8 史晓东;陈毅东;;基于语篇的机器翻译前瞻[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 周国栋;孔芳;朱巧明;;指代消解:国内外研究现状及趋势[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 宋巍;秦兵;郎君;刘挺;;句法与词义相结合的中文代词消解[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 邱明波;动词的指向对汉语第三人称代词和反身代词的句内回指的制约[D];复旦大学;2011年
2 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
3 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
4 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
5 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
6 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
7 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
8 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
9 翁依琴;汉语零形回指的认知研究[D];复旦大学;2006年
10 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 孙萍;面向事件的多文档自动文摘研究[D];江苏大学;2010年
3 张宜浩;基于最大熵模型的中文实体关系自动抽取研究[D];昆明理工大学;2010年
4 高三元;TAC-KBP评测中关键问题的研究[D];北京邮电大学;2011年
5 许婷;面向中文信息处理的复句特征分析器的研究与实现[D];华中师范大学;2011年
6 邱强;新闻语料中名词短语识别的研究[D];北京邮电大学;2011年
7 黎耀炳;面向共指消解的动态泛化机制研究[D];哈尔滨工业大学;2010年
8 刘龙;音乐领域全局实体关系抽取研究[D];哈尔滨工业大学;2010年
9 马二磊;互联网人物信息排歧技术研究[D];哈尔滨工业大学;2010年
10 魏征;交互式问答系统中的省略恢复研究[D];哈尔滨工业大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 秦洪武;第三人称代词在深层回指中的应用分析[J];当代语言学;2001年01期
2 钱伟,郭以昆,周雅倩,吴立德;基于最大熵模型的英文名词短语指代消解[J];计算机研究与发展;2003年09期
3 王厚峰;;句类中E块的作用及其判定策略[J];计算机科学;2000年05期
4 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
5 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
6 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
7 李国臣,罗云飞;采用优先选择策略的中文人称代词的指代消解[J];中文信息学报;2005年04期
8 王厚峰,梅铮;鲁棒性的汉语人称代词消解[J];软件学报;2005年05期
9 许敏,王能忠,马彦华;汉语中指代问题的研究及讨论[J];西南师范大学学报(自然科学版);1999年06期
10 刘志文,郝惠宁,肖友芙,黄曾阳;自然语言语句的HNC表示[J];语言文字应用;1998年02期
【相似文献】
中国期刊全文数据库 前10条
1 吴敏;;指代消解在普通语言学理论与课程实践上的应用研究[J];大家;2010年11期
2 庞宁;杨尔弘;;基于统计模型与规则的指代消解研究[J];太原科技;2007年05期
3 庞宁;苏尚宏;赖振丹;;中文人称代词消解研究[J];太原科技大学学报;2008年03期
4 陈九昌;孔芳;朱巧明;周国栋;;指代消解中代词待消解项识别研究[J];计算机应用与软件;2011年03期
5 颜雪松,蔡之华;一种快速聚类高维数据的算法研究[J];计算机工程;2003年01期
6 刘志成,文全刚;“K-中心点”聚类算法分析及其实现[J];电脑知识与技术;2005年06期
7 夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索;2005年03期
8 陈琦;刘蓉;周茉;罗强;;一种改进的关联规则挖掘算法[J];计算机与数字工程;2006年08期
9 杨广文,王鼎兴,郑纬民,李晓明;一种利用确定性退火技术的聚类模型与算法研究[J];软件学报;1999年06期
10 郑惠莉,吴颖;一种基于效用函数的系统划分聚类算法[J];南京邮电学院学报(自然科学版);1999年02期
中国重要会议论文全文数据库 前10条
1 李恒训;张华平;秦鹏;于满泉;刘金刚;;基于主题词的网络热点话题发现[A];第五届全国信息检索学术会议论文集[C];2009年
2 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 菅小艳;郑家恒;;一种改进的句子相似度计算方法[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
4 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
6 丁海波;肖桐;朱靖波;;基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];2010年
7 洪宇;张剑峰;杨跃辉;姚建民;朱巧明;;基于文法特征的无监督能愿词挖掘方法研究[A];第六届全国信息检索学术会议论文集[C];2010年
8 杨广林;赵云峰;王书理;;Gabor滤波器及其在图像特征提取方面的优化算法[A];2005年中国智能自动化会议论文集[C];2005年
9 孙俊;曹海龙;赵铁军;;面向句法分析的样本选择[A];第三届学生计算语言学研讨会论文集[C];2006年
10 张刚;刘悦;;基于查询空间的分布式文档集合划分算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
2 创智集团副总裁 胡乐群博士;数据挖掘在CRM中的应用[N];中国计算机报;2002年
3 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
4 袁晓静 高振平 鲁元魁;编写高质量的PB应用程序(上)[N];计算机世界;2002年
5 ;中联集团非结构化内容管理系统[N];电脑商报;2005年
6 柏荣;国家973项目在因特网大规模信息检索领域取得突破[N];中国高新技术产业导报;2003年
7 中国人民大学数据仓库与BI工程研究中心 $$  中国人民大学数据与知识工程研究所王珊、张新宇、陈红;BI三大支柱—DW、OLAP和DM[N];中国计算机报;2002年
8 中国人民大学数据仓库与商务智能工程研究中心 $$  中国人民大学数据与知识工程研究所王珊、谢佳明、陈红、刘中蔚、邵琦洪、张宁;创建数据仓库:要面向三条路线[N];中国计算机报;2002年
9 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
10 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
2 朱旭东;基于语义主题模型的人体异常行为识别研究[D];西安电子科技大学;2011年
3 蔡维玲;基于聚类的图像分割和分类器设计的研究[D];南京航空航天大学;2008年
4 孔芳;指代消解关键问题研究[D];苏州大学;2009年
5 陈劲光;基于云模型的中文面向查询多文档自动文摘研究[D];华中师范大学;2011年
6 平源;基于支持向量机的聚类及文本分类研究[D];北京邮电大学;2012年
7 任飞亮;高适应性基于实例的机器翻译中关键技术研究[D];东北大学;2008年
8 曹苏群;基于模糊Fisher准则的聚类与特征降维研究[D];江南大学;2009年
9 胡勇;面向室外场景的图像纹理分析与应用研究[D];南京理工大学;2010年
10 李世奇;面向文景转换的中文浅层语义分析方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 高俊伟;中文指代消解关键问题研究[D];苏州大学;2012年
2 刘东生;面向专利文献的中文分词技术的研究[D];沈阳航空工业学院;2010年
3 陈九昌;指代消解中待消解项识别研究[D];苏州大学;2010年
4 张宁;英文事件指代消解研究[D];苏州大学;2012年
5 王斌;双层数据流聚类框架的设计与实现[D];吉林大学;2004年
6 王清江;基于力学的聚类算法[D];大连理工大学;2006年
7 蔡博文;高维数据集中离群数据挖掘方法的研究[D];合肥工业大学;2006年
8 于世东;多维数据可视化技术的研究及应用[D];沈阳工业大学;2006年
9 于立平;图像视觉特征及其描述词汇的对齐研究[D];北京邮电大学;2010年
10 宁海燕;实体关系自动抽取技术的比较研究[D];哈尔滨工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026