《呼伦贝尔学院学报》2002年02期 加入收藏    获取最新 
 基于规则的汉语短语标注探讨
 涂云杰
   本文提出了一种基于规则的汉语句法分析方法 ,通过对已进行分词与词性标注的句子进行短语的人工标注 ,形成精确度较高的语料 ,然后提取一些规则 ,分析出短语的结构和功能类型 ,为自然语言的计算机处理提供基础研究服务。
【作者单位】:山西大学计算机科学系 太原市030006;教师
【关键词】:基于规则;短语标注;句法分析
【分类号】:H146
【DOI】:cnki:SCN:15-1202.0.2002-02-018
【正文快照】:
  一、引  言汉语短语自动划分和标注的研究目标 ,是要对一个已经完成了正确切分和词性标注处理的句子 ,经过自动分析处理 ,确定不同短语的边界位置 ,将它们用括号正确地划分出来 ,并标以合适的短语标记。由于这涉及到汉语短语结构分析和句子排歧等种种复杂的问题 ,因此是一项
 
 推荐 下载CAJ全文           下载PDF全文
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 Approaches Based on the Regular Chinese Phrases Notes
 Tu Yunjie
  This paper introduces a rule-based method used for Chinese syntactic function tagging. Through tagging some Chinese sentences with word boundary and part-of-speech information we can get very accurate corpus and we can obtain some rules to analyze the structure and function type of a phrase. Thus we can provide basic service for computer-processing of natural languages.
【Keyword】:rule-based phrase-tagging parse
 【参考文献】 共(4)篇 
 中国期刊全文数据库找到 4 条
 
1刘伟权,王明会,钟义信; 建立现代汉语依存关系的层次体系 [J]; 中文信息学报; 1996年02期
2周强; 汉语短语的自动划分和标注 [J]; 中文信息学报; 1997年01期
3周明,潘海华; 基于变换的汉语句法功能标注探讨 [J]; 中文信息学报; 1997年04期
4周强,张伟,俞士汶; 汉语树库的构建 [J]; 中文信息学报; 1997年04期
 【引证文献】 共(2)篇 
 中国优秀硕士学位论文全文数据库找到 1 条
 
1于浚涛; 基于最大熵的汉语介词短语自动识别 [D];大连理工大学; 2006年
 中国博士学位论文全文数据库找到 1 条
 
1达胡白乙拉; 蒙古语基本动词短语自动识别研究 [D];内蒙古大学; 2005年
 【共引文献】 共(71)篇 
 中国优秀硕士学位论文全文数据库找到 10 条
 
1李力; 利用知网进行(计算机)自然语言处理 [D];电子科技大学; 2004年
2詹思瑜; 自然语言的计算机处理模型 [D];电子科技大学; 2003年
3陈先华; 自然语言理解之汉语量词和名词搭配及查错系统 [D];电子科技大学; 2002年
4朱钦隽; 计算机汉语理解的初步实践 [D];电子科技大学; 2001年
5袁煜; 汉语短语歧义结构受限消歧策略探讨 [D];西南交通大学; 2004年
6周俏丽; 面向汉语单句的依存句法分析研究 [D];沈阳航空工业学院; 2006年
7张建; 面向产品设计的汉语自然语言复合句语义理解 [D];西安电子科技大学; 2006年
8钱小飞; 含“的”最长名词短语的自动识别 [D];南京师范大学; 2007年
9吴雪敏; 汉语语句的计算机分析 [D];电子科技大学; 2001年
10吕继兴; 嵌入式系统中汉字的数字输入技术研究 [D];河北农业大学; 2003年
 中国博士学位论文全文数据库找到 10 条
 
1WANG Jiayue; Chinese Keyword Extraction by Term Positions [D];广东外语外贸大学; 2003年
2方向红; 基于内涵逻辑的现代汉语连接词及关联句式语义研究 [D];上海师范大学; 2004年
3宋春阳; 面向信息处理的现代汉语“名+名”逻辑语义研究 [D];上海师范大学; 2003年
4詹卫东; 面向中文信息处理的现代汉语短语结构规则研究 [D];北京大学; 1999年
5李良炎; 基于词联接的自然语言处理技术及其应用研究 [D];重庆大学; 2004年
6彭艳; 短语结构语法与依存语法的心理现实性研究 [D];上海外国语大学; 2007年
7隋岩; 基于“动态流通语料库”的“有效字符串”提取研究 [D];北京语言大学; 2004年
8冯敏萱; 论汉英平行语料的平行处理 [D];南京师范大学; 2006年
9达胡白乙拉; 蒙古语基本动词短语自动识别研究 [D];内蒙古大学; 2005年
10高红; 基于统计语言模型的汉语浅层分析研究 [D];大连理工大学; 2007年
 中国期刊全文数据库找到 10 条
 
1蓝庆元,任海波; 计算语言学概说 [J]; 桂林师范高等专科学校学报; 2001年04期
2金博,滕弘飞,史彦军,王丹虹; 机辅写作:样本库中写作材料检索方法 [J]; 大连理工大学学报; 2002年05期
3詹卫东; 80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一 [J]; 当代语言学; 2000年02期
4党政法,周强; 短语树到依存树的自动转换研究 [J]; 中文信息学报; 2005年03期
5苑春法,陈刚,黄昌宁; 基于词性和语义知识的汉语句法规则学习 [J]; 中文信息学报; 2001年03期
6聂鑫,王作英; 汉语语句中短语间停顿的自动预测方法 [J]; 中文信息学报; 2003年04期
7牛正雨,柴佩琪; 基于边界点词性特征统计的韵律短语切分 [J]; 中文信息学报; 2001年05期
8尹一瓴,陈群秀; 现代汉语语义知识库用于句法分析的研究 [J]; 计算机应用; 2004年S2期
9郭艳华,周昌乐; 一种汉语语句依存关系网分析策略与生成算法研究 [J]; 浙江大学学报(理学版); 2000年06期
10郭艳华,周昌乐; 一种汉语语句依存关系网协动生成方法研究 [J]; 杭州电子工业学院学报; 2000年04期
 中国重要会议论文全文数据库找到 7 条
 
1董强,郝长伶,董振东; 基于《知网》的中文语块抽取器 [A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集 [C]; 2003年
2李向阳,张亚非; 一种基于语义的汉语短语识别方法 [A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集 [C]; 2004年
3张美娜,亓超,迟呈英,战学刚; 文本篇章结构的自动标引 [A];第三届学生计算语言学研讨会论文集 [C]; 2006年
4才让加,吉太加; 基于藏语语料库的词类分类方法研究 [A];第十届全国少数民族语言文字信息处理学术研讨会论文集 [C]; 2005年
5车万翔,刘挺,秦兵,李生; 面向依存文法分析的搭配抽取方法研究 [A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集 [C]; 2001年
6贾剑峰,史晓东,张慧,陈禹; 基于移进归约算法和结构化模型的依存概率句法分析器 [A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集 [C]; 2007年
7王跃龙,姬东鸿; 汉语依存图库建设研究 [A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集 [C]; 2007年
 【同被引文献】 共(40)篇 
 中国期刊全文数据库找到 10 条
 
1李珩,谭咏梅,朱靖波,姚天顺; 汉语组块识别 [J]; 东北大学学报(自然科学版); 2004年02期
2 商务印书馆成立世界汉语教学研究中心 [J]; 古汉语研究; 2005年02期
3金克木; “歧义语法”小引 [J]; 江淮论坛; 1985年01期
4宝音乌力吉,巴达玛敖斯; 关于蒙古语复合词接加后缀问题 [J]; 内蒙古大学学报(社会科学版); 1996年04期
5冯志伟; 汉语句子描述中的复杂特征 [J]; 中文信息学报; 1990年03期
6俞士汶; 自然语言的歧义与机器翻译的对策 [J]; 中文信息学报; 1989年02期
7张昱琪,周强; 汉语基本短语的自动识别 [J]; 中文信息学报; 2002年06期
8赵军,黄昌宁; 结合句法组成模板识别汉语基本名词短语的概率模型 [J]; 计算机研究与发展; 1999年11期
9詹卫东,常宝宝,俞士汶; 汉语短语结构定界歧义类型分析及分布统计 [J]; 中文信息学报; 1999年03期
10周强,黄昌宁; 汉语句法规则的自动构造方法研究 [J]; 中文信息学报; 1998年03期
 中国重要会议论文全文数据库找到 1 条
 
1李素建,刘群; 汉语组块的定义和获取 [A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集 [C]; 2003年
 【二级参考文献】 共(4)篇 
 中国期刊全文数据库找到 4 条
 
1冯志伟; 特思尼耶尔的从属关系语法 [J]; 当代语言学; 1983年01期
2黄昌宁,苑春法,潘诗梅; 语料库、知识获取和句法分析 [J]; 中文信息学报; 1992年03期
3周明,黄昌宁,张敏,白栓虎,吴升; 统计与规则并举的汉语句法分析模型 [J]; 计算机研究与发展; 1994年02期
4周明,黄昌宁; 面向语料库标注的汉语依存体系的探讨 [J]; 中文信息学报; 1994年03期
 【二级引证文献】 共(3)篇 
 中国博士学位论文全文数据库找到 1 条
 
1高莲花; 生成句法框架内的蒙古语动词及其句法结构研究 [D];中央民族大学; 2007年
 中国期刊全文数据库找到 1 条
 
1华沙宝,达胡白乙拉; 对蒙古语语料库的短语标注 [J]; 中央民族大学学报(哲学社会科学版); 2006年05期
 中国重要会议论文全文数据库找到 1 条
 
1Dabhurbayar; Research on the Ambiguous Structure of Mongolian Verb Phrase [A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集 [C]; 2007年
 【相似文献】 
 中国期刊全文数据库
 
1涂云杰; 基于规则的汉语短语标注探讨 [J];呼伦贝尔学院学报; 2002年02期; 54-58
2华沙宝,达胡白乙拉; 对蒙古语语料库的短语标注 [J];中央民族大学学报(哲学社会科学版); 2006年05期; 66-69
3华沙宝; 蒙古语短语标注策略 [J];中央民族大学学报(哲学社会科学版); 2003年05期; 99-101
4彭述初; 机器翻译学科发展综述 [J];华中科技大学学报(社会科学版); 2006年02期; 129-130
5刘颖; 对汉语切分的基于规则的错误驱动学习 [J];清华大学学报(哲学社会科学版); 1999年01期; 72-75+97
6德·青格乐图; 运用实例和规则相结合的方法进行汉—蒙机器翻译的探索 [J];内蒙古师范大学学报(哲学社会科学版); 2004年03期; 11-13+24
7林杏光,张庆旭; 简论MMT中间语言 [J];中国人民大学学报; 1996年04期; 105-108
8肖薇; 汉英机器翻译及其在科技文摘要翻译中的误例研究与分析 [J];文教资料; 2007年02期; 176-178
9刘红蕾; 基于语料库的双语词典编纂中的词性标注方法 [J];华北工学院学报(社科版); 2002年03期; 69-71
 中国优秀硕士学位论文全文数据库
 
1何岚湘; 对我国几种机器翻译软件译文质量的测评 [D];西安电子科技大学; 2001年
 中国重要会议论文全文数据库
 
1达胡白乙拉; 蒙古语基本名词短语自动标注研究 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年
2李竹; 基于英汉双语语料库的词汇自动对齐实验系统 [A];语言文字应用研究论文集(Ⅱ) [C]; 2004年
3艾山·吾买尔,吐尔根·依布拉音; 英文-维吾尔文人名机器翻译算法的研究与实现 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年
4李剑,王炳锡,郭永辉; 英汉机器翻译中基于规则的译文转换与生成 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年
5刘树杰,杨沐昀,赵铁军; 翻译规则优化中的分层优化方法 [A];第三届学生计算语言学研讨会论文集 [C]; 2006年
6史晓东,陈毅东; 基于语篇的机器翻译前瞻 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年
7郑敏,蔡莲红; 一种新的基于规则的多音字自动注音方法 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年
8颜伟; 基于动态流通语料库的VSM新词发现策略 [A];2004年辞书与数字化研讨会论文集 [C]; 2004年
9林达真,李绍滋; 基于模式分类的汉语时态确定方法研究 [A];第六届汉语词汇语义学研讨会论文集 [C]; 2005年