收藏本站
《软件学报》 2006年09期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于词汇支配度的汉语依存分析模型

刘挺  马金山  李生  
【摘要】:如何应用句法结构和词汇化是句法分析建模所面临的两个主要问题,汉语依存分析对这两方面做了初步的探索.首先通过对大规模依存树库的统计学习,获取其中的词汇依存信息,建立了一个词汇化的概率分析模型.然后引入词汇支配度的概念,以充分利用了句子中的结构信息.词汇化方法有效地弥补了以前工作中词性信息的粒度过粗问题.同时,词汇支配度增强了对句法结构的识别,有效地避免了非法结构的生成.在4000句的测试集上,依存分析获得了约74%的正确率.
【作者单位】哈尔滨工业大学信息检索研究室 哈尔滨工业大学信息检索研究室 哈尔滨工业大学信息检索研究室
【基金】:No.60435020 (国家自然科学基金重点项目) Nos.60575042, 60503072 (国家自然科学基金)~~
【分类号】:H136
【正文快照】:
随着树库资源的丰富及统计方法的深入研究,句法分析的重点逐渐转向词汇化的分析方法.而在词汇关系的表达上,依存语法较之上下文无关的短语结构语法存在的一些优势,使得依存语法的研究重新获得重视[1].依存语法是20世纪30年代提出的语法理论,用5条公理限定了其语法体系,包括汉

【引证文献】
中国期刊全文数据库 前10条
1 马金山;刘挺;李生;;基于SVM的汉语句子片段划分[J];哈尔滨工业大学学报;2009年05期
2 钟丹;朱倩;李梅;程显毅;;人称名词短语单复数信息和最大熵模型的指代消解[J];江南大学学报(自然科学版);2009年06期
3 杨芸;李剑锋;周昌乐;黄孝喜;;基于实例的汉语语义超常搭配的自动发现[J];计算机科学;2008年09期
4 沈超;;基于子树的确定性依存分析方法[J];计算机应用与软件;2011年02期
5 郎君;秦兵;刘挺;李正华;李生;;中文人称名词短语单复数自动识别[J];自动化学报;2008年08期
6 杨潇;马军;万建成;;基于局部优先和嵌套层次的二元组合语法分析模型[J];模式识别与人工智能;2009年06期
7 周惠巍;黄德根;高洁;杨元生;;最大生成树算法和决策式算法相结合的中文依存关系解析[J];中文信息学报;2012年03期
8 赵世奇;张宇;赵琳;刘挺;李生;;基于网络挖掘的上下文相关词汇级复述研究(英文)[J];软件学报;2009年07期
9 李剑锋;杨芸;周昌乐;;一种基于汉语隐喻依存句法树的嵌入式树匹配算法[J];厦门大学学报(自然科学版);2008年04期
10 曹希彬;胡辉;;基于SNS的网络挖掘系统研究[J];现代计算机(专业版);2012年19期
中国重要会议论文全文数据库 前3条
1 马金山;刘挺;李生;;面向句法分析的句子片段识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 贾剑峰;史晓东;张慧;陈禹;;基于移进归约算法和结构化模型的依存概率句法分析器[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
3 周惠巍;黄德根;高洁;杨元生;;最大生成树算法和Nivre算法相结合的中文依存关系解析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前6条
1 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
2 杨芸;汉语隐喻识别与解释计算模型研究[D];厦门大学;2008年
3 刘玉玲;自然语言信息隐藏研究[D];湖南大学;2008年
4 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
5 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
6 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
中国硕士学位论文全文数据库 前10条
1 王玉丹;基于SVM的汉语依存句法分析研究[D];中国海洋大学;2010年
2 陈丹雯;基于文本驱动的虚拟新闻生成技术研究[D];国防科学技术大学;2006年
3 杨乐;基于同义词词林的自动文摘系统的研究[D];天津大学;2007年
4 李剑锋;面向隐喻计算的汉语语义超常搭配识别模型研究[D];厦门大学;2008年
5 王金锦;面向隐喻计算的实体概念知识库构建方法研究[D];厦门大学;2009年
6 李正华;依存句法分析统计模型及树库转化研究[D];哈尔滨工业大学;2008年
7 赵琳;上下文相关的词汇复述研究[D];哈尔滨工业大学;2008年
8 朱善宗;面向情感分析的特征抽取技术研究[D];哈尔滨工业大学;2009年
9 曾莱蓓;基于虚词变换的文本隐藏信息检测方法研究[D];湖南大学;2010年
10 陈小芳;汉语术语语义分析技术研究及其应用[D];沈阳航空航天大学;2011年
【参考文献】
中国期刊全文数据库 前2条
1 刘伟权,王明会,钟义信;建立现代汉语依存关系的层次体系[J];中文信息学报;1996年02期
2 周强,黄昌宁;基于局部优先的汉语句法分析方法[J];软件学报;1999年01期
【共引文献】
中国期刊全文数据库 前10条
1 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
2 涂云杰;基于规则的汉语短语标注探讨[J];呼伦贝尔学院学报;2002年02期
3 蓝庆元,任海波;计算语言学概说[J];桂林师范高等专科学校学报(综合版);2001年04期
4 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
5 李沐,姚天顺;一种基于优先关系的LSD分析算法[J];计算机研究与发展;2001年05期
6 胡俊华,杨波,李金屏;自然语言理解研究略述[J];济南大学学报(社会科学版);2001年05期
7 王鹏,戴新宇,陈家骏,王启祥;基于规则的汉语句法分析方法研究[J];计算机工程与应用;2003年29期
8 徐艳华;陈小荷;;面向自动句法分析的“V+V”结构歧义研究[J];计算机工程与应用;2006年33期
9 佘莉,符红光;基于自然语言处理的计算机几何作图[J];计算机应用;2005年01期
10 张玉艳;杨潇;黄国栋;侯金奎;;基于图算法的二元组合文法分析[J];计算机应用;2008年07期
中国重要会议论文全文数据库 前6条
1 毛家菊;张琳;夏爱军;陆汝占;;情景中汉语指示代词短语解释的形式化[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 张美娜;亓超;迟呈英;战学刚;;文本篇章结构的自动标引[A];第三届学生计算语言学研讨会论文集[C];2006年
5 贾剑峰;史晓东;张慧;陈禹;;基于移进归约算法和结构化模型的依存概率句法分析器[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
6 高松;赵怿怡;刘海涛;;汉语特殊结构的句法标注策略[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 方向红;基于内涵逻辑的现代汉语连接词及关联句式语义研究[D];上海师范大学;2004年
3 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
4 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
5 彭艳;短语结构语法与依存语法的心理现实性研究[D];上海外国语大学;2007年
6 胡东滨;决策问题管理系统及其开发组件研究[D];中南大学;2008年
7 杨创新;基于机器学习的高性能中文文本分类研究[D];华南理工大学;2009年
8 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
9 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
10 冯秋香;基于数据库语义学的古汉语句法语义分析研究[D];大连理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘洋;基于本体的医保审计知识库构建研究[D];哈尔滨工程大学;2010年
2 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
3 王鲲;多智能体并行设计环境中自然语言通信功能的研究[D];中南大学;2002年
4 朱钦隽;计算机汉语理解的初步实践[D];电子科技大学;2001年
5 詹思瑜;自然语言的计算机处理模型[D];电子科技大学;2003年
6 张爱民;自然语言处理及其智能搜索引擎模型的设计研究[D];兰州理工大学;2003年
7 李力;利用知网进行(计算机)自然语言处理[D];电子科技大学;2004年
8 赵德玉;汉语句法分析技术及其在机器人辅助教育智能接口中的应用研究[D];天津师范大学;2004年
9 王朔;基于Chart算法的句法分析系统的设计与实现[D];湖南大学;2005年
10 余贞斌;自然语言理解的研究[D];华东师范大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
2 刘海涛;;基于依存树库的汉语句法计量研究[J];长江学术;2008年03期
3 张明杰,张跃,姚天顺;一种基于词汇功能描述的树库构建方法[J];东北大学学报;2000年03期
4 冯志伟;;特思尼耶尔的从属关系语法[J];国外语言学;1983年01期
5 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
6 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
7 董振东,董强;知网和汉语研究[J];当代语言学;2001年01期
8 王跃龙;姬东鸿;;汉语树库综述[J];当代语言学;2009年01期
9 刘挺;马金山;;汉语自动句法分析的理论与方法[J];当代语言学;2009年02期
10 顾曰国;语料库与语言研究——兼编者的话[J];当代语言学;1998年01期
中国重要会议论文全文数据库 前5条
1 车万翔;刘挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 赵铁军;李生;孟遥;黄玉;杨沐昀;;机器翻译系统中句法分析技术的研究实践[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 赵怿怡;关润池;;汉语依存树库的构建[A];第三届学生计算语言学研讨会论文集[C];2006年
4 王跃龙;韩希;;短语结构树到依存树的转换[A];第三届学生计算语言学研讨会论文集[C];2006年
5 刘海涛;;影响依存句法分析的因素探讨[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国重要报纸全文数据库 前1条
1 顾曰国;[N];中国社会科学院院报;2003年
中国博士学位论文全文数据库 前10条
1 李绍群;现代汉语“名_1+(的)+名_2”定中结构研究[D];福建师范大学;2005年
2 额尔敦朝鲁;面向信息处理的蒙古语动词语义研究[D];内蒙古大学;2005年
3 达胡白乙拉;蒙古语基本动词短语自动识别研究[D];内蒙古大学;2005年
4 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
5 徐迎晖;文本载体信息隐藏技术研究[D];北京邮电大学;2006年
6 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
7 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
8 谭松波;高性能文本分类算法研究[D];中国科学院研究生院(计算技术研究所);2006年
9 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
10 彭艳;短语结构语法与依存语法的心理现实性研究[D];上海外国语大学;2007年
中国硕士学位论文全文数据库 前3条
1 朱国华;文本信息处理中汉语句法分析方法研究[D];大连理工大学;2006年
2 张玲;词汇搭配的语义分析[D];武汉理工大学;2006年
3 周俏丽;面向汉语单句的依存句法分析研究[D];沈阳航空工业学院;2006年
【二级引证文献】
中国期刊全文数据库 前10条
1 李华;朱敏;;基于依存关系的中文句子语义分析研究[J];电脑知识与技术;2012年04期
2 张达夫;;基于依存关系匹配的长难查询处理[J];电脑知识与技术;2012年19期
3 钟丹;朱倩;李梅;程显毅;;人称名词短语单复数信息和最大熵模型的指代消解[J];江南大学学报(自然科学版);2009年06期
4 杜文洁;;用于化学文摘生成的压缩算法[J];计算机与应用化学;2010年02期
5 王金锦;杨芸;周昌乐;;隐喻字面语义表示与生成[J];中文信息学报;2009年03期
6 贾玉祥;俞士汶;;基于词典的名词性隐喻识别[J];中文信息学报;2011年02期
7 孙亚;;教育公平话语的积极隐喻分析——以《同在蓝天下——怎么看教育公平》为例[J];华文教学与研究;2011年03期
8 赵静;刘培玉;许明英;;邮件过滤中特征选择方法的性能评价与分析[J];计算机应用研究;2012年02期
9 车万翔;张梅山;刘挺;;基于主动学习的中文依存句法分析[J];中文信息学报;2012年02期
10 王洪伟;郑丽娟;尹裴;史伟;;在线评论的情感极性分类研究综述[J];情报科学;2012年08期
中国重要会议论文全文数据库 前3条
1 贾玉祥;俞士汶;;基于词典的名词性隐喻识别[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 宋纯;李斌;曲维光;陈小荷;;面向自动理解的汉语明喻句的可计算性考察[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前4条
1 黄孝喜;隐喻机器理解的若干关键问题研究[D];浙江大学;2009年
2 熊回香;面向Web3.0的大众分类研究[D];华中师范大学;2011年
3 吴戈;基于数字水印的文本信息隐藏方法的研究[D];长春理工大学;2011年
4 浑洁絮;基于语义语言的英汉机器翻译研究[D];大连理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 赵颖川;基于SVM的视频检索系统的研究和实现[D];浙江工业大学;2010年
2 王丽杰;汉语语义依存分析研究[D];哈尔滨工业大学;2010年
3 陈睿扬;面向体育新闻领域的中文简单名词短语共指消解[D];南京理工大学;2009年
4 韩兵;新闻视频故事单元关联分析技术研究[D];国防科学技术大学;2010年
5 宋静;SVM与AdaBoost算法的应用研究[D];大连海事大学;2011年
6 郑杰生;基于HMM的网络短评情感信息抽取[D];华南理工大学;2011年
7 崔弘扬;面向学科的文献资源聚类系统研究及应用[D];华中师范大学;2011年
8 刘金克;基于机器学习算法的隐喻识别研究[D];南京师范大学;2011年
9 陈鑫;基于主动学习的汉语依存树库构建[D];哈尔滨工业大学;2011年
10 付永陈;基于博客搜索的博文情感倾向性分析技术的研究[D];东北大学;2010年
【二级参考文献】
中国期刊全文数据库 前4条
1 冯志伟;;特思尼耶尔的从属关系语法[J];国外语言学;1983年01期
2 周明,黄昌宁,张敏,白栓虎,吴升;统计与规则并举的汉语句法分析模型[J];计算机研究与发展;1994年02期
3 黄昌宁,苑春法,潘诗梅;语料库、知识获取和句法分析[J];中文信息学报;1992年03期
4 周明,黄昌宁;面向语料库标注的汉语依存体系的探讨[J];中文信息学报;1994年03期
【相似文献】
中国期刊全文数据库 前10条
1 谢奎金;;英语句法分析从认知三种结构开始[J];青苹果;2009年Z1期
2 何姗;;“V起来”的句法分析[J];安徽文学(下半月);2011年06期
3 冯文贺;姬东鸿;;并列结构的依存分析与连词的控制语地位[J];语言科学;2011年02期
4 张妍妍;;基于图形-背景理论和突显观的句法分析[J];科技致富向导;2011年26期
5 邱俊标;;浅谈高职高考生英语自学能力的培养[J];新课程研究(中旬刊);2011年09期
6 陆俭明;;语言研究需要不断探索和创新——从英汉对比三例谈起[J];解放军外国语学院学报;2011年04期
7 张娣;;“不”和“没”三个平面的比较与分析[J];剑南文学(经典教苑);2011年07期
8 朱荣英;;西方科学哲学经验论立场的确立、捍卫与转变[J];天中学刊;2011年05期
9 周玉玲;;高职高专英语教学之文体学分析[J];大众科技;2011年06期
10 刘艳;;地震后砖石古建筑损坏状态评价方法研究[J];中国文物科学研究;2011年02期
中国重要会议论文全文数据库 前10条
1 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 王丹;姬东鸿;黄玮;;一种基于MIRA和遗传算法的句法分析模型构造方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 曹海龙;孟遥;李生;赵铁军;;一个改进的头驱动英语句法分析模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
4 张祥;王晓蕾;杨子宾;王剑;;动态规划理论在雷达可靠性评估中的应用[A];2009第五届苏皖两省大气探测、环境遥感与电子技术学术研讨会专辑[C];2009年
5 邹明福;童建军;刘迎建;娄正良;;基于笔划分割的联机签名鉴定[A];第八届全国汉字识别学术会议论文集[C];2002年
6 玄一民;赵焕丛;刘宏;;动态规划在多重约束下可靠性选优应用研究[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
7 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
8 陈劲光;何婷婷;李芳;桂卓民;;基于概率和句法分析的中文句子修剪[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 李跃生;;QFD与FMEA的结合性分析模型[A];第二届中国质量学术论坛会议论文集[C];2005年
10 沈树章;张学庆;;战场电磁环境分析模型本地化研究[A];2009年全国无线电应用与管理学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 ;数据分析模型失效,大摩一天亏了近4亿美元[N];新华每日电讯;2007年
2 韩雪 陈尚平;建立分析模型 开展重点评估[N];中国税务报;2006年
3 江苏省海安县海陵中学 王孝东;信息学奥赛辅导中的困惑及对策[N];中国电脑教育报;2005年
4 本报记者 周蓉蓉;BI应用的缺谁来填[N];计算机世界;2005年
5 张琳 赵伟;在Excel中创建杜邦分析模型[N];财会信报;2007年
6 陈峥;企业家的直觉与决策[N];中国工商报;2007年
7 李慧新;潜心治学成果卓著[N];经理日报;2010年
8 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
9 潘文卿(作者单位:清华大学中国经济研究中心);农业发展要实施比较优势[N];亚太经济时报;2002年
10 吴伟卿;胶粘带产业的机遇和阻力[N];中国包装报;2006年
中国博士学位论文全文数据库 前10条
1 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
2 姚文琳;汉语依存句法分析方法的研究与实现[D];中国海洋大学;2009年
3 杨潇;基于生成性概率模型的句法分析和多文档自动文摘研究[D];山东大学;2009年
4 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
5 费蓉;动态规划研究及其在电力市场动态分区定价问题中的应用[D];西安理工大学;2009年
6 于跃;基于三维地质分析模型的水电工程复杂坝基处理分析研究[D];天津大学;2010年
7 陈细谦;空间数据仓库关键技术的研究与实现[D];大连理工大学;2005年
8 金英伟;在模糊不完全定义下多目标系统模糊优选模型的研究[D];大连理工大学;2003年
9 陈秀铜;改进低温下泄水不利影响的水库生态调度方法及影响研究[D];武汉大学;2010年
10 李文华;关于分批排序问题的研究[D];郑州大学;2006年
中国硕士学位论文全文数据库 前10条
1 魏蓉;限定领域的基本陈述句句法分析[D];天津师范大学;2008年
2 胡芊;基于概率上下文无关文法的汉语句法分析方法研究[D];北京邮电大学;2009年
3 任晓娜;基于统计的汉语依存句法分析研究[D];沈阳航空航天大学;2011年
4 郎文静;规则与统计相结合的汉语依存句法分析技术研究及其应用[D];沈阳航空航天大学;2012年
5 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
6 刘琍;“程度副词+名词”的语义、语用和句法分析[D];四川师范大学;2005年
7 金天;论汉语及英语中否定歧义的消除[D];广东外语外贸大学;2007年
8 赵鹏举;风险投资机构的投资组合选择[D];郑州大学;2004年
9 于艳冬;变压器经济运行研究[D];华北电力大学(北京);2004年
10 冯凌;冬小麦土壤水、氮管理措施的优化调控[D];中国农业大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026