《文教资料》2008年09期 加入收藏    获取最新 
 基于规则的单层单标记联合结构自动识别
 王东波
   本文基于清华大学TCT973树库,详细分析了单层单标记联合结构的内部句法结构和外部语法功能并且从中统计出一定数量的规则模板;基于规则模板,结合词语的语义相似度,利用词语同形或词缀相同,对单层单标记联合结构进行了自动识别;封闭测试和开放测试的调和平均值分别为:59.74%和59.15%。实验表明,仅仅依靠联合结构的结构平行和中心语相似的特征来识别联合结构的方法基本上是行不通的。
【作者单位】:南京师范大学文学院 江苏南京210097
【关键词】:单层单标记联合结构;规则模板;语义相似度
【分类号】:H146
【DOI】:CNKI:SUN:WJZZ.0.2008-09-012
【正文快照】:
  1引言联合结构的自动识别是浅层句法分析中“语块的识别和分析”的一个内容。汉语联合结构的自动识别是浅层句法分析中的一个难点,詹卫东在《面向中文信息处理的现代汉语短语结构规则研究》(詹卫东2000)一书中提出联合式内部组成成分的限制条件“目前还难以描述”的看法。周强
 推荐 CAJ下载           PDF下载
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 【参考文献】 共(3)篇 
 中国博士学位论文全文数据库找到 1 条
 
1邓云华; 汉语联合短语的类型和共性研究 [D];湖南师范大学; 2004年
 中国期刊全文数据库找到 2 条
 
1周强,孙茂松,黄昌宁; 汉语最长名词短语的自动识别 [J]; 软件学报; 2000年02期
2董振东,董强; 面向信息处理的词汇语义研究中的若干问题 [J]; 语言文字应用; 2001年03期
 【共引文献】 共(239)篇 
 中国优秀硕士学位论文全文数据库找到 10 条
 
1韦丽娟; 泰语释义基元研究及汉泰释义基元比较 [D];南京师范大学; 2007年
2阮芝梨; 越南语和汉语基本颜色词的对比研究 [D];华中师范大学; 2006年
3孟广洁; 《现代汉语词典》释义中的括注问题研究 [D];中国社会科学院研究生院; 2005年
4王家宏; 《红楼梦》称谓语研究 [D];西南大学; 2006年
5李毅; 基于标注语料库的句子语义成分研究 [D];烟台师范学院; 2005年
6樊立三; 现代汉语语文辞书词性标注研究 [D];鲁东大学; 2006年
7徐小波; 动词词义的非自足性研究 [D];鲁东大学; 2006年
8周翰博; 俄语军事文本的局部语义分析 [D];中国人民解放军外国语学院; 2007年
9张丽杰; 网络语言的词汇学研究 [D];中央民族大学; 2004年
10郝晋阳; 魏晋南北朝墓志中的假借字研究 [D];西南师范大学; 2005年
 中国博士学位论文全文数据库找到 10 条
 
1王洪涌; 先秦两汉商业词汇—语义系统研究 [D];华中师范大学; 2006年
2郑厚尧; 汉语双音复合词的词义与语素义关系研究 [D];华中师范大学; 2006年
3王宝红; 清代笔记小说俗语词研究 [D];四川大学; 2005年
4张磊; 汉英视觉动词语法化的认知研究 [D];中央民族大学; 2006年
5史艳岚; 基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究 [D];北京语言大学; 2006年
6熊文新; 信息检索Query语言分析 [D];北京语言大学; 2006年
7李谨香; 汉俄语名词性短语的结构与功能研究 [D];黑龙江大学; 2006年
8白丽芳; 英汉元语言比较研究 [D];南京师范大学; 2006年
9冯敏萱; 论汉英平行语料的平行处理 [D];南京师范大学; 2006年
10赵家新; 现代汉语心理形容词语义网络研究 [D];南京师范大学; 2006年
 中国期刊全文数据库找到 10 条
 
1李尔钢; 建立高质量的释义元语言 [J]; 辞书研究; 2007年01期
2林新年; 谈汉语的义素和义位的研究 [J]; 福建师大福清分校学报; 2003年03期
3李春梅,吴云峰; 基于客户个性偏好的服务匹配与选择的研究 [J]; 楚雄师范学院学报; 2007年06期
4于思湘; “哇噻、嗯哼”类新兴叹词的语用义位探析 [J]; 贵州民族学院学报(哲学社会科学版); 2006年06期
5陈宇涵,任汇江; 现代汉语双音复合词的语义结构模式 [J]; 山东工商学院学报; 2003年04期
6姜岚,张志毅; 语文辞书元语言的规则 [J]; 辞书研究; 2004年05期
7于屏方,杜家利; 汉英动物词位派生义项的系统对比研究 [J]; 安阳师范学院学报; 2006年03期
8金艳艳; 汉语语义单位的新成员——意味 [J]; 辞书研究; 2003年02期
9李先华; 唐诗词语隐含义个案考察及相关问题研究 [J]; 安徽师范大学学报(人文社会科学版); 2006年06期
10解海江,张志毅; 谈《现汉》对义位褒贬陪义的标注 [J]; 辞书研究; 2003年06期
 中国重要会议论文全文数据库找到 10 条
 
1苏新春,王惠,卢伟清,秦少康; 语言知识库的内化与细化——完善词义知识库之设想 [A];第六届汉语词汇语义学研讨会论文集 [C]; 2005年
2王鹏,张永奎; 基于新闻网页主题要素的网页去重方法研究 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年
3贺瑞芳,钟绍春,程晓春; 教学资源的个性化搜索引擎研究 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年
4周强,詹卫东,任海波; 构建大规模的汉语语块库 [A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集 [C]; 2001年
5李晋霞; 面向计算机的“V_双+N_双”结构类型研究 [A];语言文字应用研究论文集(Ⅱ) [C]; 2004年
6彭国珍,邹纲; 基于汉英双语语料库述宾短语的自动抽取 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年
7李素建,刘群; 汉语组块的定义和获取 [A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集 [C]; 2003年
8周强; 汉语部分分析研究 [A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集 [C]; 2003年
9戴玲真; 从《朗文多功能分类词典》看语义场理论在分类词典编撰中的应用 [A];福建省外国语文学会2005年年会暨学术研讨会论文集 [C]; 2005年
10 Chinese-English Quasi-equivalent Noun Phrase:Definition and Automatic Identification [A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering [C]; 2005年
 【二级参考文献】 共(25)篇 
 中国期刊全文数据库找到 10 条
 
1熊文华; 论聚合短语的搭配关系 [J]; 广西教育学院学报; 1995年02期
2储泽祥,邓云华; 指示代词的类型和共性 [J]; 当代语言学; 2003年04期
3祝克懿; 联合短语的繁丰风格特征 [J]; 贵州师范大学学报(社会科学版); 1999年04期
4季永兴,熊文华; 论聚合短语的性质及汉语短语的分类 [J]; 湖北大学学报(哲学社会科学版); 1993年03期
5徐建华; 单音形容词定语连用的语序规则 [J]; 吉林大学社会科学学报; 1998年04期
6金周永; “又A又B”格式之考察 [J]; 汉语学习; 1999年04期
7秦洪武; 语言结构的顺序象似性 [J]; 外语研究; 2001年01期
8刘丹青; 汉藏语言的若干语序类型学课题 [J]; 民族语文; 2002年05期
9张健,陶寰; 论组合性并列连词 [J]; 汉语学习; 1993年05期
10董振东; 机器翻译的启示和挑战 [J]; 上海科技翻译; 1988年01期
 【相似文献】 
 中国期刊全文数据库
 
1刘颖; 对汉语切分的基于规则的错误驱动学习 [J];清华大学学报(哲学社会科学版); 1999年01期; 72-75+97
 相关机构
 > 清华大学学报(哲学社会科学版)
 相关作者
 > 刘颖
关于知网 | CNKI导报 | 知识产权声明 | 联系我们 | 知网招商
京ICP证040431号 京ICP证040441号 互联网出版许可证新出网证(京)字008号
售卡热线:800-810-6613、010-62789720、010-62773682
售后服务:800-810-1436(限座机拨打) 010-62791813、010-62783978
招商热线: 010-62772106 投诉电话:010-62791994 2007 中国知网(cnki)