收藏本站
《北京邮电大学学报》 2006年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于决策树的汉语代词共指消解

王智强  李蕾  王枞  
【摘要】:提出一种统计与规则相结合的决策树算法进行汉语代词共指消解,利用规则过滤掉属性冲突的反例,一定程度上弥补了决策树算法忽略属性关联性的缺点.采用Chinese Treebank作为语料进行测试,手工标注其中的共指关系和特征向量;首先用规则过滤,然后采用C4.5决策树算法选择先行语.实验结果显示,消解成功率为82.59%,其中人称代词和指示代词的成功率分别为87.60%和75.21%.
【作者单位】北京邮电大学智能科学技术研究中心 北京邮电大学智能科学技术研究中心 北京邮电大学智能科学技术研究中心
【关键词】自然语言理解 共指消解 汉语代词 决策树 过滤规则
【基金】:国家“863计划”项目(2004AA117310)
【分类号】:TP391.1
【正文快照】:
0引言指代也称为照应(anaphora),是自然语言中常见现象.它是指篇章中的一个语言单位(通常是词或者短语)与之前出现的语言单位存在的特殊语义关联,其语义解释依赖于前者.用于指向的语言单位称为照应语(anaphor),被指向的语言单位称为先行语(antecedent).确定照应语所指的先行

【引证文献】
中国硕士学位论文全文数据库 前2条
1 庞宁;基于最大熵模型的共指消解研究[D];山西大学;2007年
2 陈林;基于特征提取和机器学习的现代汉语人称指示代词消解研究[D];清华大学;2007年
【参考文献】
中国期刊全文数据库 前3条
1 王厚峰;汉语篇章的指代消解浅论[J];语言文字应用;2004年04期
2 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
3 李蕾,孙春葵,杨晓兰,钟义信;一种特定领域中文自动摘要系统[J];北京邮电大学学报;2000年01期
【共引文献】
中国期刊全文数据库 前9条
1 李蕾;周延泉;王菁华;;基于全信息的中文信息抽取系统及应用[J];北京邮电大学学报;2005年06期
2 张素香;李蕾;谭咏梅;;特定领域下关系模板的研究[J];北京邮电大学学报;2006年05期
3 祝庚;;一种自然语言理解语法分析器的算法实现[J];东莞理工学院学报;2006年03期
4 姚双云;;小句中枢理论的应用与复句信息工程[J];汉语学报;2005年04期
5 马竹根;一种自然语言理解中语法分析的算法设计和实现[J];计算机时代;2005年10期
6 滕弘飞;王奕首;史彦军;;人机结合的关键支持技术[J];机械工程学报;2006年11期
7 任洁;;自然语言与自然语言理解及其应用[J];科教文汇;2006年02期
8 张雷生,万绍俊,许鹏文;简单中文自动摘要系统研究[J];装备指挥技术学院学报;2004年03期
9 顾铮;顾平;;信息抽取技术在中医研究中的应用[J];医学信息;2007年01期
中国重要会议论文全文数据库 前2条
1 郭燕慧;王枞;钟义信;;语言认知与主题内容识别[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
2 梅铮;王厚峰;;汉语人称代词消解的前端处理[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前7条
1 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
2 陈清才;基于粗集的汉语建模及其应用研究[D];哈尔滨工业大学;2003年
3 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
4 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
5 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
6 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
7 刘德喜;基于基本要素的多文档自动文摘研究[D];武汉大学;2007年
中国硕士学位论文全文数据库 前6条
1 彭国兰;随机森林在企业信用评估中的应用[D];厦门大学;2007年
2 裘剑;工作流系统及其资源描述和管理研究[D];北京邮电大学;2006年
3 余建华;基于统计原理的甄别算法的研究与应用[D];南京工业大学;2006年
4 许晶;基于智能手机平台的语音识别后文本处理的应用[D];北京邮电大学;2007年
5 陈宏彦;规则和统计相结合的分词算法[D];太原理工大学;2007年
6 陈林;基于特征提取和机器学习的现代汉语人称指示代词消解研究[D];清华大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 张梅;英语论文自动评分系统探索[J];重庆大学学报(社会科学版);2005年03期
2 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报(自然科学版);1998年01期
3 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
4 张黎;汉语名词数范畴的表现方式[J];汉语学习;2003年05期
5 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
6 张剑,郭燕慧,钟义信;基于特征项的群组信息推荐算法[J];计算机工程与应用;2004年15期
7 余力,刘鲁;电子商务个性化推荐研究[J];计算机集成制造系统-CIMS;2004年10期
8 余力,刘鲁,李雪峰;用户多兴趣下的个性化推荐算法研究[J];计算机集成制造系统-CIMS;2004年12期
9 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
10 周明建,高济;知识管理中的联想检索[J];计算机应用;2004年07期
中国重要会议论文全文数据库 前1条
1 郎君;刘挺;秦兵;;基于决策树的中文名词短语指代消解[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前1条
1 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
中国硕士学位论文全文数据库 前2条
1 曹军;汉语第三人称代词消解方法研究[D];湘潭大学;2002年
2 罗云飞;中文人称代词指代消解系统的研究与实现[D];山西大学;2005年
【二级参考文献】
中国期刊全文数据库 前4条
1 钟义信;知行学引论——信息 知识 智能的统一理论[J];中国工程科学;2004年06期
2 陈桂林,王永成;Internet网络信息自动摘要的研究[J];高技术通讯;1999年02期
3 王厚峰,何婷婷;汉语中人称代词的消解研究[J];计算机学报;2001年02期
4 王厚峰;指代消解的基本方法和实现技术[J];中文信息学报;2002年06期
【相似文献】
中国期刊全文数据库 前10条
1 李渝勤;甘润生;杨永红;施水才;;基于特征分选策略的中文共指消解方法[J];计算机工程;2011年18期
2 段磊;唐常杰;左劼;彭京;刘婷婷;苟驰;;Web实时环境两级过滤中文文本内容自学习算法[J];计算机科学与探索;2011年08期
3 李学俊;;基于分词算法&VSM的文本主观题自动评分算法研究[J];电脑知识与技术;2011年25期
4 张倩;;依托智能搜索引擎构建档案信息检索系统的策略研究[J];档案与建设;2011年06期
5 张泽清;;基于领域本体的语义检索技术研究[J];赤峰学院学报(自然科学版);2011年06期
6 胡风华;王磊;;基于知识库系统的智能搜索引擎研究[J];中国新技术新产品;2011年18期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 苗传江;;HNC理论的句类[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 康海燕;樊孝忠;马礼;;自然语言理解的检索技术在数字图书馆中的应用[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 陈晓红;何晓洁;李一智;;自然语言理解在智能决策支持系统人机接口中的应用[A];全国青年管理科学与系统科学论文集(第2卷)[C];1993年
4 车万翔;刘挺;李生;;语义角色标注的方法与挑战[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
5 车万翔;刘挺;李生;;自动浅层语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 李成城;;基于修辞结构理论的自动文摘研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 俞士汶;朱学锋;刘云;;面向自然语言理解的汉语虚词研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 吕荣霞;张平安;李人厚;;智能决策支持系统中的人机系统的设计与实现[A];1992年中国控制与决策学术年会论文集[C];1992年
9 谢永康;周雅倩;黄萱菁;;一种基于谱聚类的共指消解方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 龚媛;李蕾;;语音识别后文本纠错处理[A];第三届学生计算语言学研讨会论文集[C];2006年
中国重要报纸全文数据库 前3条
1 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
2 ;重视语音理解开发[N];中国计算机报;2001年
3 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
中国博士学位论文全文数据库 前10条
1 刘根辉;计算语用学基础理论及其应用研究[D];华中科技大学;2005年
2 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
3 杨芸;汉语隐喻识别与解释计算模型研究[D];厦门大学;2008年
4 许中卫;基于双向搜索的ILP算法构建汉语语义自动切分系统[D];安徽大学;2006年
5 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
6 李晗静;基于自然语言处理的空间概念建模研究[D];哈尔滨工业大学;2007年
7 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
8 许永涛;基于E-R-P建模体系的政务信息资源元数据模型与应用研究[D];大连理工大学;2008年
9 钟美;基于Web的空间本体构建方法研究[D];武汉大学;2010年
10 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
中国硕士学位论文全文数据库 前10条
1 刘海涛;基于自然语言理解的中文搜索引擎[D];河北科技大学;2011年
2 蔡霞;基于自然语言理解的个性化Web 数据挖掘系统的设计及实现方法研究[D];浙江工业大学;2003年
3 李海林;自然语言理解及其在机务信息规范化中的应用[D];南京航空航天大学;2004年
4 赵亮;自然语言理解中基于本体的概念区分研究及其在智能仪器设计领域的应用[D];西安电子科技大学;2011年
5 李海霞;基于自然语言的图像数据库检索技术研究[D];山东师范大学;2004年
6 王萌;基于概念向量空间模型的中文自动文摘研究[D];华中师范大学;2005年
7 余贞斌;自然语言理解的研究[D];华东师范大学;2005年
8 李春明;基于全文检索的自动答疑系统的研究与设计[D];苏州大学;2005年
9 司望利;基于地理特征类型的自然语言空间关系查询[D];长安大学;2008年
10 张宗仁;基于自然语言理解的本体语义信息检索[D];暨南大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026