基于自动抽取词汇信息的双语句子对齐
【摘要】:双语语料库句子对齐已成为新一代机器翻译研究中的一个至关重要的问题.对齐方法主要有基于长度的方法和基于词汇的方法,两者各具特点:前者实现简单、效率高,但精度低;后者精度高但实现复杂.本文提出一种新的对齐方法,首先利用基于长度的方法对文本进行粗对齐,然后在双语平行文本中确定锚点并自动抽取双语对应的关键词汇,降低了对齐问题的复杂度并减少了错误的蔓延.最后再利用所得到的词汇对应信息进行句子的对齐.这种方法融合了基于长度和基于词汇方法的优点,实验表明,它很大程度地提高了对齐的精度.
|
|
|
|
| 1 |
吕雅娟,赵铁军,李生;单语句法分析指导的双语结构对齐[J];计算机研究与发展;2003年07期 |
| 2 |
邓丹,刘群,俞鸿魁;基于双语词典的汉英词语对齐算法研究[J];计算机工程;2005年16期 |
| 3 |
王秀坤,李政,简幼良,刘剑;基于Hash方法的机器翻译词典的组织与构造[J];大连理工大学学报;1996年03期 |
| 4 |
王海峰,李生,赵铁军;BT863-II汉英机器翻译系统中的兼类处理方法[J];高技术通讯;2000年01期 |
| 5 |
江红,吴立德,沙新时;机器翻译系统中概念词典的设计与实现[J];计算机研究与发展;1995年03期 |
| 6 |
王厚峰,戴大为;汉语句法结构标注的研究[J];计算机研究与发展;1997年03期 |
| 7 |
徐菁,张辉,陆汝占;汉语语料的切分标注加工系统[J];计算机工程;2003年09期 |
| 8 |
赵铁军,毛成江,张民,李生;CEMT—Ⅲ系统中汉语兼类问题的处理[J];中文信息学报;1993年04期 |
| 9 |
刘东立,滕永林,姚天顺;一种汉语电子词典的新结构[J];中文信息学报;1995年03期 |
| 10 |
杨思春,汪光阳;基于实例的机器翻译中实例匹配算法的研究[J];微机发展;2003年01期 |
|
|
|
|
|
| 1 |
刘昕,周明,朱胜火,黄昌宁;基于自动抽取词汇信息的双语句子对齐[J];计算机学报;1998年S1期 |
| 2 |
钱丽萍,赵铁军,杨沫昀,高光来;基于译文的英汉双语句子自动对齐[J];计算机工程与应用;2000年12期 |
| 3 |
孙乐,金友兵,杜林,孙玉芳;平行语料库中双语术语词典的自动抽取[J];中文信息学报;2000年06期 |
| 4 |
钱丽萍,赵铁军,杨沫昀,高光来;基于译文的英汉双语句子自动对齐[J];小型微型计算机系统;2001年01期 |
| 5 |
晋薇;黄河燕;夏云庆;;基于语义相似度并运用语言学知识进行双语语句词对齐[J];计算机科学;2002年11期 |
| 6 |
吕学强,李清隐,黄志丹,沈嫣娜,姚天顺;基于统计的汉英句子对齐研究[J];小型微型计算机系统;2004年06期 |
| 7 |
张艳,柏冈秀纪;基于长度的扩展方法的汉英句子对齐[J];中文信息学报;2005年05期 |
| 8 |
张姝,赵铁军,杨沐昀,李生;面向事件的多语平行语料库构建研究[J];计算机应用研究;2005年11期 |
| 9 |
马芳
,王炳锡
,郭永辉;一种新的自纠错句对齐算法的研究与实现[J];微计算机信息;2005年20期 |
| 10 |
刘冬明,杨尔弘,方莹;汉英双语平行语料库的词义标注[J];中文信息学报;2005年06期 |
|