收藏本站
《计算机研究与发展》 1994年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

统计与规则并举的汉语句法分析模型

周明  黄昌宁  张敏  白栓虎  吴升  
【摘要】:在自然语言分析中,传统的基于规则的方法和近年兴起的基于统计的方法各有利弊,如何把二者有机的结合起来,以提高分析器的处理能力,是当前计算语言学的重要课题。本文采用依存文法,提出了一种基于依存文法的融合语料库、规则方法和统计方法的汉语分析模型CRSP(Corpus,RuleandStatisticsbasedParser)。该模型的特点是将汉语依存文法分析看作是与词性标注过程等价的一个基于统计的标注过程。文中首先介绍了CRSP的设计思想,然后讨论了从标注过的语料中获取知识的方法,叙述了用于词性标注和依存关系标注的统计模型。试验表明这种模型具有很大的优越性。

【引证文献】
中国期刊全文数据库 前6条
1 谌志群,周昌乐;汉语机器理解研究现状及展望[J];电脑学习;1999年02期
2 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
3 周明,黄昌宁;面向语料库标注的汉语依存体系的探讨[J];中文信息学报;1994年03期
4 刘伟权,王明会,钟义信;建立现代汉语依存关系的层次体系[J];中文信息学报;1996年02期
5 王继曾;任浩征;罗恒;刘宽;;基于统计的句法分析方法研究[J];计算机工程与设计;2006年12期
6 周昌乐,秦莉娟;一种采用基于语境松弛算法的汉语分词排歧方法[J];厦门大学学报(自然科学版);2002年06期
中国博士学位论文全文数据库 前1条
1 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
中国硕士学位论文全文数据库 前10条
1 张爱民;自然语言处理及其智能搜索引擎模型的设计研究[D];兰州理工大学;2003年
2 王玉美;基于神经网络的汉语文法分析专家系统的设计与实现[D];北京工业大学;2003年
3 李岚;基于本体的汉语表层语义神经网络的构造研究[D];湘潭大学;2004年
4 周吉;自然语言处理及搜索引擎的研究[D];吉林大学;2007年
5 李伟;现代汉语句型自动识别的研究[D];厦门大学;2007年
6 张磊;基于知网的汉语隐喻自动处理[D];兰州大学;2007年
7 周文刚;基于语义的信息过滤算法及其应用[D];北方工业大学;2006年
8 余建华;基于统计原理的甄别算法的研究与应用[D];南京工业大学;2006年
9 周俏丽;面向汉语单句的依存句法分析研究[D];沈阳航空工业学院;2006年
10 张博;基于自然语言理解和领域本体的邮件过滤器的研究与设计[D];兰州理工大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 黄崑,符绍宏;自动分词技术及其在信息检索中应用的研究[J];现代图书情报技术;2001年03期
2 尹锋;汉语自动分词研究的现状与新思维[J];现代图书情报技术;1998年04期
3 周刚;连词产生和发展的历史要略[J];安徽大学学报(哲学社会科学版);2003年01期
4 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
5 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
6 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
7 谭丹,鲜继清;基于NDIS hook的Windows防火墙驱动程序设计[J];重庆邮电学院学报(自然科学版);2005年05期
8 高泽胜,陶宏才;基于NDIS-HOOK技术的个人防火墙的研究与实现[J];成都信息工程学院学报;2004年03期
9 张俐,李晶皎,胡明涵,姚天顺;中文WordNet的研究及实现[J];东北大学学报(自然科学版);2003年04期
10 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报(自然科学版);2003年06期
中国博士学位论文全文数据库 前6条
1 张蕾;概念结构及其应用[D];西北工业大学;2001年
2 邓云华;汉语联合短语的类型和共性研究[D];湖南师范大学;2004年
3 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
4 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
5 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
6 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年
中国硕士学位论文全文数据库 前9条
1 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
2 张红;语义网中的本体推理及其应用研究[D];吉林大学;2004年
3 李岚;基于本体的汉语表层语义神经网络的构造研究[D];湘潭大学;2004年
4 郝天永;基于本体的宗教知识获取[D];兰州理工大学;2005年
5 皮晓峰;基于概率上下文无关语法的句法分析研究与实现[D];电子科技大学;2005年
6 朱国华;文本信息处理中汉语句法分析方法研究[D];大连理工大学;2006年
7 尹鹏;基于SVM的中文组块间依存关系分析[D];大连理工大学;2006年
8 钱小飞;含“的”最长名词短语的自动识别[D];南京师范大学;2007年
9 图格木勒;蒙古语语言资源库建设相关技术研究[D];内蒙古大学;2007年
【二级引证文献】
中国期刊全文数据库 前10条
1 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
2 索东梅;自然语言理解研究[J];长春师范学院学报;2005年02期
3 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
4 涂云杰;基于规则的汉语短语标注探讨[J];呼伦贝尔学院学报;2002年02期
5 蓝庆元,任海波;计算语言学概说[J];桂林师范高等专科学校学报;2001年04期
6 白永强,李四四,窦丽华,陈杰;基于规则推理和自然语言理解的坦克火控知识库系统[J];火力与指挥控制;2005年02期
7 周桂芝;CALL的局限性与英语教师角色的转换[J];河南机电高等专科学校学报;2004年03期
8 郭艳华,周昌乐;一种汉语语句依存关系网协动生成方法研究[J];杭州电子工业学院学报;2000年04期
9 郭艳华,周昌乐;一种汉语语句依存关系网分析策略与生成算法研究[J];浙江大学学报(理学版);2000年06期
10 舒鑫柱,杨尔弘;基于HOWNET的汉语组块分析[J];河南职技师院学报;2001年04期
中国重要会议论文全文数据库 前3条
1 马金山;刘挺;李生;;基于n-gram及依存分析的中文自动查错方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 贾剑峰;史晓东;张慧;陈禹;;基于移进归约算法和结构化模型的依存概率句法分析器[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
3 王跃龙;姬东鸿;;汉语依存图库建设研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 郭忠伟;作战文书自动生成理论及方法研究[D];南京理工大学;2003年
3 方向红;基于内涵逻辑的现代汉语连接词及关联句式语义研究[D];上海师范大学;2004年
4 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
5 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
6 谷建军;基于叙词表的中医古籍文献领域本体建模方法研究[D];中国中医科学院;2006年
7 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
8 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 蒲宝山;较薄煤层高效开采工作面设备优化配套研究[D];煤炭科学研究总院;2006年
中国硕士学位论文全文数据库 前10条
1 李海军;基于语义的汉语短语结构歧义研究与实现[D];西北大学;2006年
2 翟凤文;统计与字典相结合的中文分词[D];吉林大学;2005年
3 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
4 朱钦隽;计算机汉语理解的初步实践[D];电子科技大学;2001年
5 李辉阳;面向CAI的简述文字判读技术及其应用研究[D];湘潭大学;2002年
6 马彦辉;区域可持续发展决策支持系统模型库的研究与实现[D];河北工业大学;2002年
7 巢文涵;基于CFM的汉语小句语义分析[D];中国人民解放军国防科学技术大学;2002年
8 李娜;面向作战文书智能处理的电子词典的研究与实现[D];南京理工大学;2003年
9 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
10 詹思瑜;自然语言的计算机处理模型[D];电子科技大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 张普;关于大规模真实文本语料库的几点理论思考[J];语言文字应用;1999年01期
2 王爽;熊德兰;王晓霞;;基于实例的古文机器翻译设计与实现[J];许昌学院学报;2009年05期
3 张亮;王树梅;黄河燕;张孝飞;;面向中文问答系统的问句句法分析[J];山东大学学报(理学版);2006年03期
4 王清;殷业;;基于Globish的旅游用英汉翻译系统的研究[J];企业科技与发展;2008年12期
5 袁煜;;正则表达式在外语教学及研究中的应用[J];软件导刊;2011年01期
6 贾自艳,史忠植;基于概率统计技术和规则方法的新词发现[J];计算机工程;2004年20期
7 何婷婷;谢芳;;利用BP神经网络的中文词义消歧模型[J];华中师范大学学报(自然科学版);2005年04期
8 黄万武;孙炳文;;数据驱动语言学习—教学模式的转变[J];武汉科技学院学报;2006年11期
9 姜涛;姚天顺;张俐;;基于实例的中文分词-词性标注方法的应用研究[J];小型微型计算机系统;2007年11期
10 付华军;陈吕芳;;试论数据驱动语言学习对教学模式的影响[J];科技经济市场;2007年12期
中国重要会议论文全文数据库 前10条
1 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
2 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 董娜;林碧琴;丁丰;;机器翻译中若干问题的探讨[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
4 林哲民;;为微型语料库标记词类使用田野调查人员记录及基于转换的自动学习[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 何伟;侯敏;文采菊;;流行语时空监测模型研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 许小星;亢世勇;;基于标注语料库的主谓谓语句的语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 朱凯;周杰;何婷婷;;因特网语料自动下载分析软件的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
9 杨二宝;吕学强;朱靖波;姚天顺;;一种汉英翻译模板提取方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 吐尔根·依布拉音;阿里甫·库尔班维尼拉·木沙江;;面向汉维机器翻译的双语对齐语料库设计与实现[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
中国重要报纸全文数据库 前8条
1 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
2 ;轻松跨越语言障碍[N];中国电脑教育报;2004年
3 ;翻译软件:实用翻译+语音翻译[N];中国计算机报;2002年
4 ;智能接口六大技术[N];计算机世界;2001年
5 ;翻译软件编辑选择奖获奖产品展示[N];中国计算机报;2002年
6 记者 王燕元;首信融RONEASE进军电子商务[N];中国贸易报;2008年
7 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
8 李人凡;传统书业数字出版的障碍和突破[N];中国新闻出版报;2011年
中国博士学位论文全文数据库 前10条
1 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
2 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
3 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
4 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
5 张京楣;基于统计方法的文本风格分析研究[D];山东大学;2012年
6 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
7 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年
8 余振山;自然语言文本中数字水印的设计与研究[D];中国科学技术大学;2009年
9 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
10 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
中国硕士学位论文全文数据库 前10条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
2 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
3 葛运东;跨语言信息检索查询翻译技术研究[D];苏州大学;2010年
4 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
5 程洁;语音翻译词典的设计实现与系统评估[D];哈尔滨工程大学;2004年
6 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
7 罗云飞;中文人称代词指代消解系统的研究与实现[D];山西大学;2005年
8 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
9 段恩泽;基于统计的汉语自动分词系统[D];电子科技大学;2005年
10 刘杰;基于唐诗语料词的提取与统计分析的研究[D];吉林大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026