| | | | | 蒙古文词根、词干、词尾的自动切分系统 | | | 那顺乌日图 | | | 在蒙文信息处理工作的词处理阶段,自动切分构形词尾和词根、词干是多项后续工作的基础。如,词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分”为基础。词根、词干和词尾的切分迄今为止都是人工完成的,所以存在着速度慢、人力投入大以及出现因人而异,前后不一致等问题。本系统从计算机自动切分的角度对蒙古语构形词尾进行了分类,在具有两万多词条的《蒙汉辞典》和一百万词级的《现代蒙古语数据库》语料的基础上考察和比较了蒙古语的词根、词干和构形词尾,在传统语法的研究成果和计算语言学方法相结合的基础上把蒙古文近200种词尾分成三大类,并根据各类词尾的不同特点编制了几种词典,设计,提出了二十多组语法条件和若干个生成规则,在计算机上实现了自动切分。据测试,使用该系统可以覆,盖现代蒙古语各类文本的95%以上。 【作者单位】:内蒙古大学蒙古语文研究所 【关键词】:蒙古文,词根,词干,词尾,自动切分,系统 【基金】:国家自然科学基金 【分类号】:H53 【DOI】:cnki:ISSN:1000-5218.0.1997-02-008 【正文快照】: 蒙古文词根、词干、词尾的自动切分系统那顺乌日图(内蒙古大学蒙古语文研究所)内容提要:在蒙文信息处理工作的词处理阶段,自动切分构形词尾和词根、词干是多项后续工作的基础。如,词汇和词尾的统计,各种词典的编制,进行句处理,篇章处理等都需要以正确的“切分”为基础。词根、词干和词尾的切分迄今为止都是人工完成的,所以存在着速度慢、人力投入大以及出现因人而异,前后不一致等问题。本系统从计算机自动切分的角度对蒙古语构形词尾进行了分类,在具有两万多词条的《蒙汉辞典》和一百万词级的《现代蒙古语数据库》语料的基础上… | | | 推荐 CAJ下载 PDF下载 | | | CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式 |
| | | | | | 1 | 吴小穗; 关键词检索系统的研究 [J];大学图书情报学刊; 1999年04期 | | 2 | 李蓉
,叶世伟
,史忠植; SVM-KNN分类器——一种提高SVM分类精度的新方法 [J];电子学报; 2002年05期 | | 3 | 商务印书馆成立世界汉语教学研究中心 [J];古汉语研究; 2005年02期 | | 4 | 李剑冲; 汉蒙语言人称代词对比分析 [J];内蒙古师范大学学报(哲学社会科学版); 2003年06期 | | 5 | 王俊义,敖其尔,姗丹,孟和吉雅; 英蒙汉电子词典的研究与设计 [J];内蒙古大学学报(自然科学版); 1999年03期 | | 6 | 赵斯琴,高光来,何敏; 蒙古语语料库的研究与建设 [J];内蒙古大学学报(自然科学版); 2003年05期 | | 7 | 俞士汶,段慧明,朱学锋,孙斌; 北京大学现代汉语语料库基本加工规范 [J];中文信息学报; 2002年05期 | | 8 | 汪云,周大军,张烨; 语料库在外语词汇教学中的应用 [J];基础教育外语教学研究; 2003年02期 | | 9 | 道尔吉,郭志菊; 论蒙汉语人体词语的特点及文化意蕴 [J];内蒙古社会科学(汉文版); 2003年06期 | | 10 | 陈昌来; 动后趋向动词性质研究述评 [J];汉语学习; 1994年02期 |
|
| | | | | | 1 | M. F. Porter; An algorithm for suffix stripping [M];Program; 1980年 | | 2 | G. Salton, M. J. Mcgill; An Introduction to Modern Information Retrieval [M];; 1983年 | | 3 | Cortes C, Vapnik V; Support Vector Networks [M];Machine Learning; 1995年 | | 4 | Sebastiani F; Machine learning in automated text categorization [M];ACM Computing Survey; 2002年 | | 5 | Aas K, and Eikvil A; Text Categorisation: A urvey [M];Technical report, Norwegian Computing Center,; 1999.年 | | 6 | Lewis D. D, and Ringuette M; A comparison of two learning algorithms for text categorization [M];Proceeding of the Third Annual Symposium on Document Analysis and Information Retrieval; 1994年 | | 7 | Buckley C, Salton G, Allan J, and Singhal A; Automatic Query Expansion Using SMART: TREC 3 [M];Proc. 3rd Text Retrieval Conference, NIST; 1994年 | | 8 | Thorsten Joachims; Text Categorization with support Vector Machines: Learning with Many Relevant Features [M];; 年 | | 9 | J. J. Rocchio; Relevance feedback in information retrieval [M];the SMART Retrieval System-Experiments in Automatic Document Processing; 1971年 | | 10 | Yiming Yang; An evaluation of statistical approach to text categorization [M];Technical Report CMU-CS-97-127, Computer Science Department. Camegie Mellon University; 1997年 |
|
|
|