《华北工学院学报(社科版)》2002年03期 加入收藏    获取最新 
 基于语料库的双语词典编纂中的词性标注方法
 刘红蕾
   语科库作为自然发生的语言资料的集合 ,它反映了某一种语言的用法特征及其多样性 ;它为词典编篡提供了翔实可靠的依据。利用英语语言学研究的成果 ,结合语料库中常见的词性标注方法 ,对运用于双语词典编纂的 CONU L EXID语料库系统中的语料词性标注问题进行了初步的探讨。
【作者单位】:南京林业大学人文学院 江苏南京;210037
【关键词】:词性标注;语料库;双语词典编纂
【分类号】:H06
【DOI】:cnki:ISSN:1009-4520.0.2002-03-022
【正文快照】:
  语料库作为自然发生的大量语言资料的集合 ,其语料通常反映了某一语言的用法特征及其多样性。语料库的建立为词典编纂、语言现象研究 ,以及语言教学研究等提供了翔实可靠的依据。依据语料形式语料库可分为以下几种 :文本及语音语料库、口语及书面语语料库以及单语种及多语种语
 推荐 CAJ下载           PDF下载
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 Part-of -speech Tagging in Corpus-based Bilingual Dictionary Compilation
 LIU Hong lei (School of Humanities Studies;Nanjing Forestry University;210037 Nanjing)
  Corpus,as a collection of naturally occured utferances,reflects peculiar usages and diversily of a language; the establishment of a corpus offers solid basis for language research and dictionary compilation.Part of speech tagging is the most basic type of annotation to be performed on corpora. This paper attempts to propose a rule based part of speech tagging scheme to annotate CONULEXID, which is a computerized bilingual corpus utilized in the bilingual lexicography.
【Keyword】:part of speech tagging;corpora;bilingual lexicography
 【共引文献】 共(25)篇 
 中国期刊全文数据库找到 10 条
 
1胡明扬; 当代语言学 [J];广播电视大学学报(哲学社会科学版); 2000年04期
2樊孝忠,柳林,任锋; 汉字智能输入刍议 [J];兵工自动化; 1995年04期
3才藏太,华关加; 班智达汉藏公文翻译系统中基于二分法的句法分析方法研究 [J];中文信息学报; 2005年06期
4周继如; 机械制造工艺汉英自动翻译系统的研究与实践 [J];南京师范大学学报(工程技术版); 2001年01期
5周继如,陈实; 工艺语言描述中的自动翻译模型的建立 [J];南京师范大学学报(工程技术版); 2002年03期
6程节华,戴新宇,陈家骏,王启祥; 汉英机器翻译中时体态处理 [J];计算机应用研究; 2004年03期
7玉素甫·艾白都拉,吾守尔·斯拉木; 维语中心语驱动文法句法分析器中的上下文相关处理 [J];计算机应用与软件; 1999年06期
8王逍,张俊华,张榆锋,施心陵; 一种基于实时联想的自然语言句子生成方法 [J];计算机应用; 2002年10期
9毕玉德; 关于语义信息处理的语义角色系统的构建 [J];民族语文; 2003年03期
10才智杰; 藏汉英电子词典的开发研究 [J];青海师范大学学报(自然科学版); 2005年02期
 中国优秀硕士学位论文全文数据库找到 3 条
 
1黄永文; 基于互信息的统计语言模型平滑技术 [D];重庆大学; 2005年
2张瑞霞; 基于语义的汉语句法分析系统的研究与实现 [D];西北大学; 2005年
3刘阳; “隐性小词表+专业小词库”的自动分词技术研究 [D];湖南师范大学; 2007年
 中国博士学位论文全文数据库找到 2 条
 
1张蕾; 概念结构及其应用 [D];西北工业大学; 2001年
2赵小兵; 基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究 [D];北京语言大学; 2007年
 中国重要会议论文全文数据库找到 4 条
 
1扎洛,索南仁欠; 语言信息处理的现代藏语词性分类方法研究 [A];第十届全国少数民族语言文字信息处理学术研讨会论文集 [C]; 2005年
2才让加,吉太加; 藏语语料库中词性分类代码的确定 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年
3才藏太,华却才让; 藏语语料库加工和处理用的藏文切分词典的建立与设计 [A];第十届全国少数民族语言文字信息处理学术研讨会论文集 [C]; 2005年
4刘红蕾; 浅谈基于语料库双语词典编纂中词性标注的必要性 [A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集 [C]; 2003年
 【相似文献】 
 中国期刊全文数据库
 
1刘红蕾; 基于语料库的双语词典编纂中的词性标注方法 [J];华北工学院学报(社科版); 2002年03期; 69-71
2李慧贤; 《古代汉语虚词词典》词性标注的问题 [J];现代语文(语言研究版); 2006年08期; 114-115
3王鸿滨; 从《左传》主题句中“以”的词性判定看语文词典词性标注问题 [J];玉林师范学院学报; 2001年04期; 72-74
4应利,叶秋生; 《现代汉语词典》(第5版)几个属性词标注存疑 [J];乐山师范学院学报; 2007年04期; 93-94
5杨翠兰; 汉语成语的语法功能研究 [J];烟台教育学院学报; 2005年03期; 28-31+61
6马楠; 由语文词典词性标注引发的思考 [J];甘肃高师学报; 2007年03期; 4-7
7徐时仪; 语言文化差异的比较──双语词典编纂的灵魂 [J];喀什师范学院学报; 1997年04期; 82-87
8张思洁,刘洁云; 论双语词典的横组合释义原则——兼评《新时代英汉大词典》 [J];中北大学学报(社会科学版); 2006年02期; 33-38
9郭曙纶; 汉语人名标注及其方法 [J];零陵学院学报; 2003年03期; 24-26
10方芳; 基于语料库的量名短语识别初探 [J];乐山师范学院学报; 2006年02期; 62-64
 中国优秀硕士学位论文全文数据库
 
1刘曼; 对外汉语教学中的词类体系和词性标注 [D];辽宁师范大学; 2004年
2齐艳艳; 《现代汉语词典》单音节副词词性标注、释义及条目分立考察 [D];北京语言大学; 2004年
3樊立三; 现代汉语语文辞书词性标注研究 [D];鲁东大学; 2006年
4徐兆娟; 语用学视角下的双语词典词语定义研究 [D];广西师范大学; 2006年
5袁伟; 现代汉语词典标注词性之比较与批评 [D];苏州大学; 2006年
6刘亚杰; 名、动、形词类标注分岐的考察与处理 [D];黑龙江大学; 2005年
7肖盛生; “规范辞书”的“规范”问题 [D];南昌大学; 2006年
8周云; 汉语越南语机器翻译实验系统 [D];中国人民解放军外国语学院; 2006年
9吴玉荣; 汉语水平考试大纲(HSK)制订、调整的历史演变研究 [D];吉林大学; 2006年
 中国博士学位论文全文数据库
 
1郭永辉; 英汉机器翻译系统关键技术研究 [D];解放军信息工程大学; 2006年
2冯敏萱; 论汉英平行语料的平行处理 [D];南京师范大学; 2006年
3陈伟; 学理反思与策略重构 [D];广东外语外贸大学; 2006年
4杨建国; 基于动态流通语料库(DCC)的汉语熟语单位研究 [D];北京语言大学; 2005年
 中国重要会议论文全文数据库
 
1赵大明; 关于《现代汉语规范字典》的词性标注 [A];中国辞书论集1999 [C]; 1999年
2林红,胡欣; 最大熵模型的应用 [A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集 [C]; 2003年
3陈文亮,朱靖波,吕学强,姚天顺; 词性标注规则的获取和优化 [A];第一届学生计算语言学研讨会论文集 [C]; 2002年
4李红印; 颜色词的收词、释义和词性标注 [A];中国辞书论集2001 [C]; 2001年
5钱揖丽,张虎; 汉语分词及词性标注自动校验方法研究 [A];第一届学生计算语言学研讨会论文集 [C]; 2002年
6郭锐; 语文词典的词性标注问题 [A];中国辞书学文集 [C]; 1998年
7毛永波; 辞书的词义解释和词性标注 [A];中国辞书学文集 [C]; 1998年
8迟铎,白玉林; 浅谈语文词典词性标注问题 [A];中国辞书学文集 [C]; 1998年
9李志江; 关于语文辞书词性标注的探讨 [A];中国辞书学文集 [C]; 1998年
10程荣; 汉语辞书中词性标注引发的相关问题 [A];中国辞书学文集 [C]; 1998年
 中国重要报纸全文数据库
 
1教育部语言文字信息管理司司长李宇明; 语言文字工作应当与时俱进 [N];中国教育报; 2001年
2语言所 董琨; 错误百出 贻笑大方 [N];中国社会科学院院报; 2004年
关于知网 | CNKI导报 | 知识产权声明 | 联系我们 | 知网招商
京ICP证040431号 京ICP证040441号 互联网出版许可证新出网证(京)字008号
售卡热线:800-810-6613、010-62789720、010-62773682
售后服务:800-810-1436(限座机拨打) 010-62791813、010-62783978
招商热线: 010-62772106 投诉电话:010-62791994 2007 中国知网(cnki)