《内蒙古大学学报(人文.社会科学版)》1997年02期 加入收藏    获取最新 
 蒙古文词根、词干、词尾的自动切分系统
 那顺乌日图
   在蒙文信息处理工作的词处理阶段,自动切分构形词尾和词根、词干是多项后续工作的基础。如,词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分”为基础。词根、词干和词尾的切分迄今为止都是人工完成的,所以存在着速度慢、人力投入大以及出现因人而异,前后不一致等问题。本系统从计算机自动切分的角度对蒙古语构形词尾进行了分类,在具有两万多词条的《蒙汉辞典》和一百万词级的《现代蒙古语数据库》语料的基础上考察和比较了蒙古语的词根、词干和构形词尾,在传统语法的研究成果和计算语言学方法相结合的基础上把蒙古文近200种词尾分成三大类,并根据各类词尾的不同特点编制了几种词典,设计,提出了二十多组语法条件和若干个生成规则,在计算机上实现了自动切分。据测试,使用该系统可以覆,盖现代蒙古语各类文本的95%以上。
【作者单位】:内蒙古大学蒙古语文研究所
【关键词】:蒙古文,词根,词干,词尾,自动切分,系统
【基金】:国家自然科学基金
【分类号】:H53
【DOI】:cnki:ISSN:1000-5218.0.1997-02-008
【正文快照】:
  蒙古文词根、词干、词尾的自动切分系统那顺乌日图(内蒙古大学蒙古语文研究所)内容提要:在蒙文信息处理工作的词处理阶段,自动切分构形词尾和词根、词干是多项后续工作的基础。如,词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分”为基础。词根、词干和词尾的切分迄今为止都是人工完成的,所以存在着速度慢、人力投入大以及出现因人而异,前后不一致等问题。本系统从计算机自动切分的角度对蒙古语构形词尾进行了分类,在具有两万多词条的《蒙汉辞典》和一百万词级的《现代蒙古语数据库》语料的基础上…
 推荐 CAJ下载           PDF下载
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 【引证文献】 共(5)篇 
 中国期刊全文数据库找到 1 条
 
1菊花; 蒙古文单词音节自动拆分软件的设计 [J];内蒙古师范大学学报(自然科学汉文版); 2006年04期
 中国优秀硕士学位论文全文数据库找到 3 条
 
1菊花; 基于语料的初中蒙语文生词分析软件的设计 [D];内蒙古师范大学; 2006年
2策日玛; 汉语述补结构在蒙古语中的对应形式 [D];东北师范大学; 2007年
3苏道; 蒙文文本分类技术研究与系统设计实现 [D];内蒙古大学; 2007年
 中国重要会议论文全文数据库找到 1 条
 
1那顺乌日图,雪艳,叶嘉明; 现代蒙古语语料库加工技术的新进展——新一代蒙古语词语自动切分与标注系(Darhan Tagging System) [A];第十届全国少数民族语言文字信息处理学术研讨会论文集 [C]; 2005年
 【同被引文献】 共(47)篇 
 中国期刊全文数据库找到 10 条
 
1吴小穗; 关键词检索系统的研究 [J];大学图书情报学刊; 1999年04期
2李蓉 ,叶世伟 ,史忠植; SVM-KNN分类器——一种提高SVM分类精度的新方法 [J];电子学报; 2002年05期
3 商务印书馆成立世界汉语教学研究中心 [J];古汉语研究; 2005年02期
4李剑冲; 汉蒙语言人称代词对比分析 [J];内蒙古师范大学学报(哲学社会科学版); 2003年06期
5王俊义,敖其尔,姗丹,孟和吉雅; 英蒙汉电子词典的研究与设计 [J];内蒙古大学学报(自然科学版); 1999年03期
6赵斯琴,高光来,何敏; 蒙古语语料库的研究与建设 [J];内蒙古大学学报(自然科学版); 2003年05期
7俞士汶,段慧明,朱学锋,孙斌; 北京大学现代汉语语料库基本加工规范 [J];中文信息学报; 2002年05期
8汪云,周大军,张烨; 语料库在外语词汇教学中的应用 [J];基础教育外语教学研究; 2003年02期
9道尔吉,郭志菊; 论蒙汉语人体词语的特点及文化意蕴 [J];内蒙古社会科学(汉文版); 2003年06期
10陈昌来; 动后趋向动词性质研究述评 [J];汉语学习; 1994年02期
 中国优秀硕士学位论文全文数据库找到 1 条
 
1淑琴; 《蒙古语语法信息词典构形附加成分分库》的设计与实现 [D];内蒙古大学; 2005年
 中国博士学位论文全文数据库找到 2 条
 
1李锦姬; 现代汉语补语研究 [D];复旦大学; 2003年
2何婷婷; 语料库研究 [D];华中师范大学; 2003年
 西文参考文献找到 10 条
 
1M. F. Porter; An algorithm for suffix stripping [M];Program; 1980年
2G. Salton, M. J. Mcgill; An Introduction to Modern Information Retrieval [M];; 1983年
3Cortes C, Vapnik V; Support Vector Networks [M];Machine Learning; 1995年
4Sebastiani F; Machine learning in automated text categorization [M];ACM Computing Survey; 2002年
5Aas K, and Eikvil A; Text Categorisation: A urvey [M];Technical report, Norwegian Computing Center,; 1999.年
6Lewis D. D, and Ringuette M; A comparison of two learning algorithms for text categorization [M];Proceeding of the Third Annual Symposium on Document Analysis and Information Retrieval; 1994年
7Buckley C, Salton G, Allan J, and Singhal A; Automatic Query Expansion Using SMART: TREC 3 [M];Proc. 3rd Text Retrieval Conference, NIST; 1994年
8Thorsten Joachims; Text Categorization with support Vector Machines: Learning with Many Relevant Features [M];; 年
9J. J. Rocchio; Relevance feedback in information retrieval [M];the SMART Retrieval System-Experiments in Automatic Document Processing; 1971年
10Yiming Yang; An evaluation of statistical approach to text categorization [M];Technical Report CMU-CS-97-127, Computer Science Department. Camegie Mellon University; 1997年
 【相似文献】 
 中国期刊全文数据库
 
1那顺乌日图; 蒙古文词根、词干、词尾的自动切分系统 [J];内蒙古大学学报(人文.社会科学版); 1997年02期; 53-57
2王麦莅,崔德民; 英语后缀“-ist”的由来与演变 [J];河北师范大学学报(哲学社会科学版); 1995年01期; 104-107
3莫伟; 词尾可否为辞?——时枝语法词类划分之我见 [J];怀化学院学报; 2004年03期; 119-121
4徐惠鹏; 浅析日语送假名规律 [J];合肥工业大学学报(社会科学版); 1987年04期; 154-158
5金忠实; 词尾“■■”与“■■■”的对比 [J];延边大学学报(社会科学版); 1998年04期; 143-145
6邰薇薇; 掌握阅读技巧 提高阅读能力 [J];辽宁师专学报(社会科学版); 2001年03期; 125-126
7杨育乔; 现代俄语重音的移动规律 [J];兰州大学学报(社会科学版); 1980年04期; 125-137
8李建生,张迎秋; 名词单数第二格词尾-y(-ю)的演变 [J];中学俄语; 2002年08期; 23-24
9 握手ABC [J];小雪花(小学快乐作文); 2003年27期; 14-15
10孙述宇; 陆谷孙《英汉大辞典》中的辞源说明 [J];北京大学学报(哲学社会科学版); 1995年01期; 113-118+107
 中国优秀硕士学位论文全文数据库
 
1周进辉; 带-И3МM后缀术语的汉译 [D];华中师范大学; 2005年
2汪莉萍; 词汇联想与中国英语学习者的词汇习得 [D];苏州大学; 2002年
3于韶君; 俄语带-cя动词的功能语义研究 [D];首都师范大学; 2004年
4孙静; 会话中的惯例化语言 [D];辽宁师范大学; 2004年
5裴京姬; 韩日亲属称谓的对比研究 [D];延边大学; 2005年
 中国重要会议论文全文数据库
 
1王晓鹰,章宜华; 同学科同词尾英文医学术语中文译名的系统性 [A];中国辞书论集2001 [C]; 2001年
2郭颖侠; 关于日语形容动词词干的用法 [A];外语语言教学研究——黑龙江省外国语学会第十次学术年会论文集 [C]; 1996年
3魏以达; 试论世界语和英语的词缀体系 [A];湖北省世界语协会世界语研讨会论文集(1980-2002) [C]; 2002年
关于知网 | CNKI导报 | 知识产权声明 | 联系我们 | 知网招商
京ICP证040431号 京ICP证040441号 互联网出版许可证新出网证(京)字008号
售卡热线:800-810-6613、010-62789720、010-62773682
售后服务:800-810-1436(限座机拨打) 010-62791813、010-62783978
招商热线: 010-62772106 投诉电话:010-62791994 2007 中国知网(cnki)