基于自动抽取词汇信息的双语句子对齐
【摘要】:双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点:前者实现简单、效率高,但精度低;后者精度高但实现复杂.本文提出一种新的对齐方法,首先利用基于长度的方法对文本进行粗对齐,然后在双语平行文本中确定锚点并自动抽取双语对应的关键词汇,降低了对齐问题的复杂度并减少了错误的蔓延.最后再利用所得到的词汇对应信息进行句子的对齐.这种方法融合了基于长度和基于词汇方法的优点,实验表明,它很大程度地提高了对齐的精度.
|
|
|
|
| 1 |
王秀坤,李政,简幼良,刘剑;基于Hash方法的机器翻译词典的组织与构造[J];大连理工大学学报;1996年03期 |
| 2 |
王海峰,李生,赵铁军;BT863-II汉英机器翻译系统中的兼类处理方法[J];高技术通讯;2000年01期 |
| 3 |
江红,吴立德,沙新时;机器翻译系统中概念词典的设计与实现[J];计算机研究与发展;1995年03期 |
| 4 |
王厚峰,戴大为;汉语句法结构标注的研究[J];计算机研究与发展;1997年03期 |
| 5 |
徐菁,张辉,陆汝占;汉语语料的切分标注加工系统[J];计算机工程;2003年09期 |
| 6 |
赵铁军,毛成江,张民,李生;CEMT—Ⅲ系统中汉语兼类问题的处理[J];中文信息学报;1993年04期 |
| 7 |
刘东立,滕永林,姚天顺;一种汉语电子词典的新结构[J];中文信息学报;1995年03期 |
| 8 |
杨思春,汪光阳;基于实例的机器翻译中实例匹配算法的研究[J];微机发展;2003年01期 |
| 9 |
安清波;计算机双语词典结构研究[J];现代计算机;2000年11期 |
| 10 |
吴保民,杜祝平,张连海,王炳锡;Matlink英汉机器翻译试验系统中词典的存储结构及搜索算法[J];信息工程大学学报;2001年04期 |
|
|
|
|
|
| 1 |
赵铁军;李生;高文;;机器翻译研究的现状与发展方向[J];计算机科学;1996年03期 |
| 2 |
刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰;基于词典和统计的语料库词汇级对齐算法[J];情报学报;1997年01期 |
| 3 |
刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期 |
| 4 |
钱丽萍,赵铁军,杨沫昀,高光来;基于译文的英汉双语句子自动对齐[J];计算机工程与应用;2000年12期 |
| 5 |
孙乐,金友兵,杜林,孙玉芳;平行语料库中双语术语词典的自动抽取[J];中文信息学报;2000年06期 |
| 6 |
王斌;基于未对齐汉英双语库的翻译对抽取[J];中文信息学报;2000年06期 |
| 7 |
杨沐昀,李生,赵铁军;汉英双语标注集的研究与实现[J];情报学报;2000年05期 |
| 8 |
王斌,刘群,张祥;汉英双语库自动分段对齐研究[J];软件学报;2000年11期 |
| 9 |
聂建云,陈江;利用平行网页建立中英文统计翻译模型[J];中文信息学报;2001年01期 |
| 10 |
钱丽萍,赵铁军,杨沫昀,高光来;基于译文的英汉双语句子自动对齐[J];小型微型计算机系统;2001年01期 |
|