《常州工学院学报(社科版)》2005年03期 加入收藏    获取最新 
 “者”缀词识别
 冯敏萱,杨翠兰,陈小荷
   通过对1200万字语料的统计得出,派生词约占词条总数的8.66%,构成派生词的词缀共有188个。其中,后缀“者”所构成的派生词词条数最多,构词成分最为复杂。我们采用基本词表、词例知识规则并结合词语的搭配、共现频率的混合策略对带后缀“者”的派生词进行了自动识别,封闭测试的精确率为93.06%,开放测试的精确率为82.40%。
【作者单位】:南京师范大学文学院 江苏南京210097 (冯敏萱;杨翠兰);南京师范大学文学院 江苏南京210097(陈小荷)
【关键词】:派生词;后缀;;自动识别
【分类号】:H146.1;
【DOI】:cnki:ISSN:1673-0887.0.2005-03-018
【正文快照】:
  在中文信息处理领域,分词的一大难点就是未登录词识别。随着社会的不断发展,语言词汇也在不断变化,不断地产生着新词。新时期产生的新词数量十分巨大,几乎涉及到了社会的各个领域。根据汉语的构词特点,我们可以看出,汉语构词一直以“复合法”为主(“词根”与“词根”结合),以“派生法”为辅的(“词根”与“词缀”结合)。但近年来,汉语新词语的构词过程正兴起“词缀化”倾向,凡是同类或者近类概念的事物都会很快地打上相应的词汇标记。汉语中,词缀化的词明显增多,实词“词缀化”倾向的产生,将使派生法构词具有越来越重要的意义。研究派生词识…
 推荐 CAJ下载           PDF下载
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 【引证文献】 共(2)篇 
 中国优秀硕士学位论文全文数据库找到 1 条
 
1齐焕美; 《祖堂集》词缀研究 [D];上海师范大学; 2006年
 中国博士学位论文全文数据库找到 1 条
 
1尹海良; 现代汉语类词缀研究 [D];山东大学; 2007年
 【共引文献】 共(200)篇 
 中国期刊全文数据库找到 10 条
 
1韩明; 浅议通感的结构特征 [J];中共成都市委党校学报; 2006年02期
2常文芳,郜峰; “被”字句、被动句和受事主语句之间的关系 [J];巢湖学院学报; 2005年01期
3苏金智; 论当前汉语外来词规范的原则 [J];辞书研究; 2002年03期
4张颖,刘常飞; 承德地名的词语修饰 [J];承德民族师专学报; 2006年03期
5甘宇慧; 语境分析与现场报道 [J];浙江传媒学院学报; 2006年05期
6宋伶俐; 从汉语词缀的定义看“词缀化” [J];广东教育学院学报; 2006年06期
7魏旭; 超常组配:文学的语用策略 [J];涪陵师范学院学报; 2006年02期
8黄国春; 现代汉语根字构词量刍议 [J];广西民族学院学报(哲学社会科学版); 2006年06期
9许建中; 现代汉语语音教学艺术探讨 [J];达县师范高等专科学校学报; 2003年03期
10王凌; 散谈词类活用 [J];安徽水利水电职业技术学院学报; 2006年01期
 中国优秀硕士学位论文全文数据库找到 10 条
 
1石静; 篇章结构与接受心理 [D];华东师范大学; 2003年
2王玲娟; 《盐铁论》复音词研究 [D];新疆大学; 2006年
3乌兰; 汉语第二语言教学中双音节形容词三分法分类教学理论初探 [D];内蒙古师范大学; 2005年
4李明; 常用汉字部件分析与对外汉字教学研究 [D];北京语言大学; 2006年
5欧阳戎元; 《荀子》句型研究 [D];新疆大学; 2005年
6王小郴; 复句的预设和复句研究 [D];福建师范大学; 2004年
7郭洪蔚; 鲁迅周作人对现代杂文文体的创造 [D];青岛大学; 2004年
8郑媛; 汉语被动式的界定及其语法化 [D];山东大学; 2005年
9许芃; 《庄子》隐喻、转喻造词的认知分析 [D];山东大学; 2005年
10金美兰; 汉语假设连词及其英语对应形式研究 [D];延边大学; 2006年
 中国博士学位论文全文数据库找到 10 条
 
1王洪涌; 先秦两汉商业词汇—语义系统研究 [D];华中师范大学; 2006年
2许凤才; 俄汉语主从复合句的对比研究 [D];上海外国语大学; 2006年
3张金桥; 汉语句子理解中语言表达的命题表征项目互换效应 [D];华南师范大学; 2003年
4韩秀娟; 基于动态流通语料库的通用词语用字研究及字词语关系考察 [D];北京语言大学; 2007年
5张尹琼; 疑问代词的非疑问用法 [D];复旦大学; 2005年
6李绍群; 现代汉语“名_1+(的)+名_2”定中结构研究 [D];福建师范大学; 2005年
7孙艳; 汉藏语四音格词研究 [D];中央民族大学; 2005年
8胡培安; 时间词语的内部组构与表达功能研究 [D];华东师范大学; 2005年
9郭裕建; 语感及其心理机制 [D];华东师范大学; 2002年
10胡晓华; 郭璞注释语言词汇研究 [D];浙江大学; 2005年
 中国重要会议论文全文数据库找到 1 条
 
1张晗; 英汉构词法对比研究 [A];福建省外国语文学会2006年年会暨学术研讨会论文集(下) [C]; 2006年
 【同被引文献】 共(141)篇 
 中国期刊全文数据库找到 10 条
 
1朱茂汉; 名词后缀“子”、“儿”、“头” [J];安徽师范大学学报(人文社会科学版); 1982年01期
2石锓; 近代汉语词尾“生”的功能 [J];古汉语研究; 1996年02期
3吴燕青; 浅谈广西象州话的语缀 [J];广西教育学院学报; 2002年01期
4周日健; 广东省惠东客家方言的语缀 [J];方言; 1994年02期
5周南; “中国小说古今通识国际学术研讨会”综述 [J];东岳论丛; 2006年06期
6陈秀兰; 对许理和教授《最早的佛经译文中的东汉口语成分》一文的几点补充 [J];古汉语研究; 1997年02期
7林连通; 福建永春方言词汇(二) [J];方言; 1988年01期
8戴耀晶; 语义缀和语法缀——英语词缀性质浅析 [J];赣南师范学院学报; 1987年04期
9谢自立,刘丹青,石汝杰,汪平,张家茂; 苏州方言里的语缀(一) [J];方言; 1989年02期
10曹小云; 《西游记》中的人称代词前缀“是” [J];古汉语研究; 1996年04期
 中国优秀硕士学位论文全文数据库找到 1 条
 
1齐焕美; 《祖堂集》词缀研究 [D];上海师范大学; 2006年
 中国博士学位论文全文数据库找到 1 条
 
1张磊; 汉英视觉动词语法化的认知研究 [D];中央民族大学; 2006年
 中国重要会议论文全文数据库找到 2 条
 
1徐艳华,亢世勇; 基于数据库的新造词语的构词法研究 [A];第一届学生计算语言学研讨会论文集 [C]; 2002年
2方芳,冯敏萱; 含词尾的三字新词识别 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年
 【二级引证文献】 共(1)篇 
 中国博士学位论文全文数据库找到 1 条
 
1尹海良; 现代汉语类词缀研究 [D];山东大学; 2007年
 【相似文献】 
 中国期刊全文数据库
 
1冯敏萱,杨翠兰,陈小荷; “者”缀词识别 [J];常州工学院学报(社科版); 2005年03期; 82-86
2马忠建; 西夏语派生词构词法之我见 [J];宁夏社会科学; 1989年01期; 86-94
3孟美菊,王建民; 帛书《五十二病方》“者”字用法浅析 [J];黔西南民族师范高等专科学校学报; 2002年02期; 59-61
4沈玉保; 仿造的派生词“小私” [J];阅读与写作; 2007年06期; 51
5邢向东; 晋语圪头词流变论 [J];内蒙古师范大学学报(哲学社会科学版); 1987年02期; 83-90
6汪洪澜; 汉英派生词比较研究 [J];宁夏大学学报(社会科学版); 1997年04期; 17-20+124
7李枫; “A·B者”结构之我见 [J];湖北师范学院学报(哲学社会科学版); 2001年04期; 109-112
8哈米提·扎克尔; 后缀/+ki/及其它 [J];新疆大学学报(社会科学版); 2002年03期; 122-127
9王红梅; 吉林洮南方言中的后缀“的” [J];北方论丛; 2003年06期; 83-86
10刘雪梅; 古今词缀探析 [J];和田师范专科学校学报; 2006年05期; 94-95
 中国优秀硕士学位论文全文数据库
 
1王茂春; 现代汉语后缀“者”构词规律的初步研究 [D];四川大学; 2005年
2赵艳平; 《现代汉语词典》所收词缀探析 [D];河北大学; 2005年
3李贵生; 《史记》“者”字研究 [D];西北师范大学; 2005年
4钱小飞; 含“的”最长名词短语的自动识别 [D];南京师范大学; 2007年
5杨上元; 汉语发展大趋势:造字复体化与造词复合化 [D];中国海洋大学; 2005年
6齐焕美; 《祖堂集》词缀研究 [D];上海师范大学; 2006年
7宋喆; 现代维吾尔语词汇构成途径新探 [D];新疆大学; 2006年
8尚英; 基于大规模调查的动词重叠形式自动识别方法与形式特征研究 [D];北京语言大学; 2004年
9任双平; 明清山东方言附加式构词法初探 [D];山东大学; 2005年
10闫凡蕾; “V_双+V_双”的语义关系类型及其自动识别 [D];广西大学; 2004年
 中国博士学位论文全文数据库
 
1石德富; 台湾卑南语构词法研究 [D];中央民族大学; 2004年
2李国英; 小篆形声字研究 [D];北京师范大学; 1989年
3达胡白乙拉; 蒙古语基本动词短语自动识别研究 [D];内蒙古大学; 2005年
 中国重要会议论文全文数据库
 
1李树兰; 满语动词zhafambi的词义分析 [A];满学研究(第三辑) [C]; 1996年
2肖华云,常宝宝,俞士汶; 中文词、词组对应英文翻译的自动识别 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年
 中国重要报纸全文数据库
 
1驻京记者 李扬; 自动识别六种少数民族文字 [N];文汇报; 2007年
2沈锡伦; 语言中的类推现象 [N];语言文字周报; 2007年
3沈锡伦; 语言发展的内部原因 [N];语言文字周报; 2007年
4思文; 让语言具有穿透力 [N];云南经济日报; 2001年
5焦国标; 读轻声的“价” [N];人民日报海外版; 2001年
关于知网 | CNKI导报 | 知识产权声明 | 联系我们 | 知网招商
京ICP证040431号 京ICP证040441号 互联网出版许可证新出网证(京)字008号
售卡热线:800-810-6613、010-62789720、010-62773682
售后服务:800-810-1436(限座机拨打) 010-62791813、010-62783978
招商热线: 010-62772106 投诉电话:010-62791994 2007 中国知网(cnki)