| | | | | 基于规则的单层单标记联合结构自动识别 | | | 王东波 | | | 本文基于清华大学TCT973树库,详细分析了单层单标记联合结构的内部句法结构和外部语法功能并且从中统计出一定数量的规则模板;基于规则模板,结合词语的语义相似度,利用词语同形或词缀相同,对单层单标记联合结构进行了自动识别;封闭测试和开放测试的调和平均值分别为:59.74%和59.15%。实验表明,仅仅依靠联合结构的结构平行和中心语相似的特征来识别联合结构的方法基本上是行不通的。 【作者单位】:南京师范大学文学院 江苏南京210097 【关键词】:单层单标记联合结构;规则模板;语义相似度 【分类号】:H146 【DOI】:CNKI:SUN:WJZZ.0.2008-09-012 【正文快照】: 1引言联合结构的自动识别是浅层句法分析中“语块的识别和分析”的一个内容。汉语联合结构的自动识别是浅层句法分析中的一个难点,詹卫东在《面向中文信息处理的现代汉语短语结构规则研究》(詹卫东2000)一书中提出联合式内部组成成分的限制条件“目前还难以描述”的看法。周强 | | | 推荐 CAJ下载 PDF下载 | | | CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式 |
| | | | | | 1 | 苏新春,王惠,卢伟清,秦少康; 语言知识库的内化与细化——完善词义知识库之设想 [A];第六届汉语词汇语义学研讨会论文集 [C]; 2005年 | | 2 | 王鹏,张永奎; 基于新闻网页主题要素的网页去重方法研究 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年 | | 3 | 贺瑞芳,钟绍春,程晓春; 教学资源的个性化搜索引擎研究 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年 | | 4 | 周强,詹卫东,任海波; 构建大规模的汉语语块库 [A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集 [C]; 2001年 | | 5 | 李晋霞; 面向计算机的“V_双+N_双”结构类型研究 [A];语言文字应用研究论文集(Ⅱ) [C]; 2004年 | | 6 | 彭国珍,邹纲; 基于汉英双语语料库述宾短语的自动抽取 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年 | | 7 | 李素建,刘群; 汉语组块的定义和获取 [A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集 [C]; 2003年 | | 8 | 周强; 汉语部分分析研究 [A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集 [C]; 2003年 | | 9 | 戴玲真; 从《朗文多功能分类词典》看语义场理论在分类词典编撰中的应用 [A];福建省外国语文学会2005年年会暨学术研讨会论文集 [C]; 2005年 | | 10 | Chinese-English Quasi-equivalent Noun Phrase:Definition and Automatic Identification [A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering [C]; 2005年 |
|
|
|