收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于词串粒度及权值的汉语句子相似度衡量

王荣波  池哲儒  常宝宝  柏晓静  
【摘要】:提出了一种改进的汉语句子相似度衡量方法,用于基于实例的汉英机器翻译。该方法同时考虑了相同词串的数目及长度和对应的权值信息,克服了传统方法的显著不足,在理论上更有合理性。在小数据集上的实验也表明该方法是可行的。

知网文化
【相似文献】
中国重要会议论文全文数据库 前10条
1 池哲洁;池毓焕;张全;;从迭句中辨识出三类花园幽径句[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 侯敏;孙建军;;基于汉英机器翻译的名词回指分析——句组研究之二[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 池毓焕;李颖;;面向汉英机器翻译的大句范式初探[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
4 吴云芳;;疑问句中的“怎么”在汉英机器翻译中的词汇歧义化解[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 吐尔根·依布拉音;阿里甫·库尔班维尼拉·木沙江;;面向汉维机器翻译的双语对齐语料库设计与实现[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
6 ;哈尔滨工业大学语言语音教育部微软重点实验室简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
7 张克亮;;简明状态句及其汉英句类和句式转换[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 苏贵洋 ;李建华 ;马颖华;;XML统一文本自动处理描述接口[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 张霄军;;Web汉英平行新闻语料获取的困难及对策[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
10 王治敏;李勉东;;谓词带定式的配价研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前2条
1 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
2 夏云庆;IHSMTS系统中启发式类比翻译处理机制(HATM)的设计与实现[D];中国科学院研究生院(计算技术研究所);2001年
中国硕士学位论文全文数据库 前7条
1 王浩;使用多层对齐框架进行基于实例机器翻译研究[D];电子科技大学;2009年
2 洪青阳;汉英机器翻译英文生成模块XMGEN的设计与实现[D];厦门大学;2001年
3 陈毅东;汉英机器翻译系统英文生成中的一种选词模型研究[D];厦门大学;2002年
4 魏瑾;基于统计的汉英机器翻译技术的研究[D];国防科学技术大学;2006年
5 杨晓峰;汉英机器翻译系统中的一种语义排岐模型研究[D];厦门大学;2001年
6 何晓峰;基于短语的汉英统计机器翻译系统的设计与实现[D];山东大学;2009年
7 张春国;工艺语句汉英计算机辅助翻译系统关键技术研究[D];南京航空航天大学;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978