期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《计算机学报》 1998年S1期
加入收藏 获取最新

基于自动抽取词汇信息的双语句子对齐

刘昕  周明  朱胜火  黄昌宁  
【摘要】:双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点:前者实现简单、效率高,但精度低;后者精度高但实现复杂.本文提出一种新的对齐方法,首先利用基于长度的方法对文本进行粗对齐,然后在双语平行文本中确定锚点并自动抽取双语对应的关键词汇,降低了对齐问题的复杂度并减少了错误的蔓延.最后再利用所得到的词汇对应信息进行句子的对齐.这种方法融合了基于长度和基于词汇方法的优点,实验表明,它很大程度地提高了对齐的精度.
【作者单位】清华大学计算机科学与技术系!北京 100084 清华大学智能技术与系统国家重点实验室!北京 100084
【关键词】双语语料库 句子对齐 机器翻译
【基金】:国家自然科学基金 航天预研基金
【分类号】:TP391.2
【DOI】:cnki:ISSN:0254-4164.0.1998-S1-027
【正文快照】:
1引言自80年代以来,基于统计(Statistics-based)和基于实例(Example-based)方法的出现及其广泛应用,标志着机器翻译进入了一个新时期[’j.这两种方法共同的特点是:它们把双语语料库(ParallelcorP0ra)直接或间接地作为翻译的知识库.双语语料库可以有多种组织形
全文下载: CAJ格式 (推荐) PDF格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【引证文献】
中国期刊全文数据库 前2条
1 张艳,柏冈秀纪;基于长度的扩展方法的汉英句子对齐[J];中文信息学报;2005年05期
2 钱丽萍,赵铁军,杨沫昀,高光来;基于译文的英汉双语句子自动对齐[J];小型微型计算机系统;2001年01期
中国重要会议论文全文数据库 前3条
1 吕雅娟;赵铁军;李生;杨沐昀;;统计和词典方法相结合的双语语料库词对齐[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 李维刚;刘挺;王震;李生;;双语语料库段落重组对齐方法研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 杨建;杨沐昀;于浩;时晓升;;面向译文质量的EBMT系统实例库优化研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国硕士学位论文全文数据库 前4条
1 张春国;工艺语句汉英计算机辅助翻译系统关键技术研究[D];南京航空航天大学;2004年
2 张健;基于实例的机器翻译的泛化方法研究[D];中国科学院研究生院(计算技术研究所);2001年
3 李继锋;基于双层模板结构的机器翻译方法研究[D];中国科学院研究生院(计算技术研究所);2003年
4 热西旦;汉文—维吾尔文双语语料库构建的实验性研究[D];新疆大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 王秀坤,李政,简幼良,刘剑;基于Hash方法的机器翻译词典的组织与构造[J];大连理工大学学报;1996年03期
2 王海峰,李生,赵铁军;BT863-II汉英机器翻译系统中的兼类处理方法[J];高技术通讯;2000年01期
3 江红,吴立德,沙新时;机器翻译系统中概念词典的设计与实现[J];计算机研究与发展;1995年03期
4 王厚峰,戴大为;汉语句法结构标注的研究[J];计算机研究与发展;1997年03期
5 徐菁,张辉,陆汝占;汉语语料的切分标注加工系统[J];计算机工程;2003年09期
6 赵铁军,毛成江,张民,李生;CEMT—Ⅲ系统中汉语兼类问题的处理[J];中文信息学报;1993年04期
7 刘东立,滕永林,姚天顺;一种汉语电子词典的新结构[J];中文信息学报;1995年03期
8 杨思春,汪光阳;基于实例的机器翻译中实例匹配算法的研究[J];微机发展;2003年01期
9 安清波;计算机双语词典结构研究[J];现代计算机;2000年11期
10 吴保民,杜祝平,张连海,王炳锡;Matlink英汉机器翻译试验系统中词典的存储结构及搜索算法[J];信息工程大学学报;2001年04期
中国重要会议论文全文数据库 前3条
1 柏晓静;常宝宝;詹卫东;吴拥华;;构建大规模的汉英双语平行语料库[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
2 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
3 刘非凡;赵军;徐波;;大规模非限定领域汉英双语语料库建设及句子对齐研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前1条
1 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
中国硕士学位论文全文数据库 前5条
1 祝志杰;IHSMTS中汉英双语句子对齐机制的设计与实现[D];南京理工大学;2002年
2 王飞;多语种双语对齐平台的设计与实现[D];南京理工大学;2004年
3 常红;现代维吾尔语基本词汇研究[D];新疆大学;2005年
4 毕雪华;汉维双语语料库中句子对齐技术的研究[D];新疆大学;2006年
5 陈鹏;基于语料库的维吾尔语词干提取和词性标注[D];新疆大学;2006年
【二级引证文献】
中国期刊全文数据库 前4条
1 吕学强,吴宏林,姚天顺;无双语词典的英汉词对齐[J];计算机学报;2004年08期
2 吕雅娟,李生,赵铁军;基于双语模型的汉语句法分析知识自动获取[J];计算机学报;2003年01期
3 淑琴;那顺乌日图;;面向EBMT系统的汉蒙双语语料库的构建[J];内蒙古社会科学(汉文版);2006年01期
4 胡国全,陈家骏,戴新宇,尹存燕;一种基于实例的汉英机器翻译策略[J];计算机工程与设计;2005年04期
中国重要会议论文全文数据库 前2条
1 Chun-xiang Zhang, Tie-jun Zhao, Sheng Li School of Computer Science and Technology, Harbin Institute of Technology, 150001, China;AUTOMATIC ACQUISITION OF TRANSLATION EQUIVALENCES FROM BILINGUAL CORPUS[A];多种语言信息处理国际学术会议论文集[C];2005年
2 陈群秀;;计算机辅助翻译系统漫谈[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
中国博士学位论文全文数据库 前2条
1 武斌;面向俄文信息处理的机器翻译实验研究[D];中国人民解放军外国语学院;2007年
2 方淼;语义单元自动获取研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前5条
1 毕雪华;汉维双语语料库中句子对齐技术的研究[D];新疆大学;2006年
2 钱之莹;汉英/英汉平行翻译语料库的设计及其在翻译中的应用[D];华东师范大学;2005年
3 许超;汉英双语网页资源中相同事件文本对的提取[D];南京师范大学;2005年
4 刘建基;基于关联度和词对齐的双语组块获取研究[D];南京理工大学;2006年
5 邓丹;汉英词语对齐技术研究[D];中国科学院研究生院(计算技术研究所);2004年
【相似文献】
中国期刊全文数据库 前10条
1 赵铁军;李生;高文;;机器翻译研究的现状与发展方向[J];计算机科学;1996年03期
2 刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰;基于词典和统计的语料库词汇级对齐算法[J];情报学报;1997年01期
3 刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期
4 钱丽萍,赵铁军,杨沫昀,高光来;基于译文的英汉双语句子自动对齐[J];计算机工程与应用;2000年12期
5 孙乐,金友兵,杜林,孙玉芳;平行语料库中双语术语词典的自动抽取[J];中文信息学报;2000年06期
6 王斌;基于未对齐汉英双语库的翻译对抽取[J];中文信息学报;2000年06期
7 杨沐昀,李生,赵铁军;汉英双语标注集的研究与实现[J];情报学报;2000年05期
8 王斌,刘群,张祥;汉英双语库自动分段对齐研究[J];软件学报;2000年11期
9 聂建云,陈江;利用平行网页建立中英文统计翻译模型[J];中文信息学报;2001年01期
10 钱丽萍,赵铁军,杨沫昀,高光来;基于译文的英汉双语句子自动对齐[J];小型微型计算机系统;2001年01期
中国重要会议论文全文数据库 前10条
1 吕雅娟;赵铁军;李生;杨沐昀;;统计和词典方法相结合的双语语料库词对齐[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 柏晓静;常宝宝;詹卫东;吴拥华;;构建大规模的汉英双语平行语料库[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
3 何站涛;韩兆强;闫栗丽;;机器翻译质量的研究与探讨[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
4 刘晓月;杨沐昀;赵铁军;;迭代策略和词典相结合的机器翻译词典获取[A];第一届学生计算语言学研讨会论文集[C];2002年
5 吕学强;李清隐;任飞亮;姚天顺;;基于统计的汉英句子对齐研究[A];第一届学生计算语言学研讨会论文集[C];2002年
6 李维刚;刘挺;王震;李生;;双语语料库段落重组对齐方法研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 刘非凡;赵军;徐波;;大规模非限定领域汉英双语语料库建设及句子对齐研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 吴尉林;屈刚;陆汝占;;基于锚词对的英汉双语语段对齐模型[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 杨建;杨沐昀;于浩;时晓升;;面向译文质量的EBMT系统实例库优化研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 肖华云;常宝宝;俞士汶;;中文词、词组对应英文翻译的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前3条
1 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
2 姚润皋 王月清;好风借力上云天[N];新华日报;2003年
3 ;机器翻译在电子政务系统建设中的应用[N];中国电脑教育报;2004年
中国博士学位论文全文数据库 前4条
1 李安兴;双语语料库与汉英词典词目翻译质量的进一步提高[D];复旦大学;2005年
2 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
3 王斌;汉英双语语料库自动对齐研究[D];中国科学院研究生院(计算技术研究所);1999年
4 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
中国硕士学位论文全文数据库 前9条
1 祝志杰;IHSMTS中汉英双语句子对齐机制的设计与实现[D];南京理工大学;2002年
2 张少平;基于结构化自然语言的算法规约研究[D];江西师范大学;2003年
3 薛松;汉英平行语料库中名词短语对齐算法的研究[D];中国科学院研究生院(软件研究所);2003年
4 王飞;多语种双语对齐平台的设计与实现[D];南京理工大学;2004年
5 刘力力;中成药名的深层语义分析[D];大连理工大学;2005年
6 郭红梅;双语对齐技术研究[D];北京邮电大学;2006年
7 毕雪华;汉维双语语料库中句子对齐技术的研究[D];新疆大学;2006年
8 唐亚芳;汉英名实体词对齐技术的研究[D];哈尔滨工业大学;2006年
9 黄新艳;基于英汉双语语料库的英汉双语Ontology的建立与管理[D];中国海洋大学;2006年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭