收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种维吾尔语句子相似度算法的研究

田生伟  吐尔根·依布拉音  禹龙  买合木提·木合买提  艾山·吾买尔  
【摘要】:基于实例的机器翻译是一种重要的机器翻译技术,句子相似度的衡量是基于实例机器翻译研究中最重要的一个内容。对于基于实例的维吾尔语机器翻译研究,维吾尔语句子相似度衡量的准确性,直接影响到最后翻译结果的输出。提出了一种维吾尔语句子相似度的计算方法,采用的基于词形特征的粗选算法、散列单词倒排索引能够有效提高算法的查找速度,快速从语料库中筛选出候选句子集合;多策略精选算法中采用基于维吾尔语词频的单词区分度算法、连续单词序列抽取算法,可以有效衡量两个维吾尔语句子的相似程度,实验结果证明算法是有效的。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 何炎祥,冯夏根,周水庚;演化算法在中文自动分词中的应用[J];计算机工程;2002年05期
2 刘红芝;;中文分词技术的研究[J];电脑开发与应用;2010年03期
3 岑咏华;;一种基于多重哈希词典和K-最短路径算法的中文粗分词方案研究[J];情报理论与实践;2009年03期
4 安见才让;;藏语句子相似度算法的研究[J];中文信息学报;2011年04期
5 杨鸿武;梁青青;郭威彤;李锦珑;陈龙;;一个面向言语工程的兰州方言语料库[J];西北师范大学学报(自然科学版);2009年06期
6 刘小虎,吴葳,李生,赵铁军,蔡萌,鞠英杰;基于词典和统计的语料库词汇级对齐算法[J];情报学报;1997年01期
7 谈文蓉;符红光;刘莉;杨宪泽;;一种基于贝叶斯分类与机读词典的多义词排歧方法[J];计算机应用;2006年06期
8 单显明;;基于数据挖掘技术的炮兵雷达故障诊断[J];火控雷达技术;2011年03期
9 张玉叶;;解读“匈牙利法”——对《“匈牙利法”存在的问题及改进方法》一文的质疑[J];计算机时代;2011年10期
10 冯玉才;卢正鼎;张岚;;实现联接运算的有效算法——CRDS中的联接运算的实现[J];计算机工程与应用;1989年09期
11 张普;关于大规模真实文本语料库的几点理论思考[J];语言文字应用;1999年01期
12 黄铁英,姜昱明;一种快速手写汉字细化算法[J];计算机工程;2004年19期
13 龙腾芳,杨路明;一种基于多目标综合决策的算法[J];计算机应用与软件;2005年06期
14 张超,张家树,陈辉,贾东立;基于局部模糊熵的图像过渡区提取算法[J];西南交通大学学报;2005年05期
15 孙玉强;周蕾;刘三阳;王洪元;张英丽;;基于PRAM模型的CFGs并行识别与语法分析的扩充算法[J];计算机科学;2005年08期
16 顾沈明;吴伟志;高济;;不完备信息系统中知识获取算法[J];计算机科学;2005年09期
17 许红梅;许毅;;多QOS约束的动态多播路由算法[J];交通与计算机;2006年01期
18 姜新农;王文香;;基于免疫遗传的BP网络在机械手逆运动学中的应用[J];机械与电子;2006年01期
19 王岚;翟正军;;Web日志挖掘的预处理及路径补全算法的研究[J];微电子学与计算机;2006年08期
20 陈曦;李国清;宋吉江;李宏图;;某型军机多功能显示系统的仿真[J];系统仿真学报;2006年S2期
中国重要会议论文全文数据库 前10条
1 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年
2 梁红梅;尹晓霞;李宇庄;;有关语料库驱动下的外语在线自主学习的工作底稿[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
3 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
4 宋鸿彦;刘军;姚天昉;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年
6 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
7 郭启新;;论语料库与英汉词典配例[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
8 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 蔡莲红;蔡锐;吴志勇;陶建华;;语音合成语料库的设计与声学特征分析[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
10 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 唐煜;均匀设计的组合性质及其构作[D];苏州大学;2005年
2 余金华;电阻层析成像技术应用研究[D];浙江大学;2005年
3 Zhao Peixin;[D];山东大学;2005年
4 吕翔;波长路由光网络相关问题研究[D];浙江大学;2006年
5 申远;一些求解结构型优化的一阶算法[D];南京大学;2012年
6 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年
7 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
8 杨奎元;基于深层结构的图像内容分析及其应用[D];中国科学技术大学;2012年
9 夏云;基于语料库的英汉翻译小说常规化研究:历时的视角[D];山东大学;2010年
10 刘建鹏;语料库支撑的系统功能语法研究[D];西南大学;2012年
中国硕士学位论文全文数据库 前10条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
2 徐琰;基于语料库的ONLY研究[D];大连海事大学;2003年
3 李淼;用先进的语料库工具推进英语教学[D];首都师范大学;2004年
4 李春青;[D];电子科技大学;2004年
5 王蓉;新闻英语的批评性语篇分析[D];上海师范大学;2010年
6 刘鼎甲;连接成分的显化:基于语料库的中英文翻译文本对比[D];燕山大学;2010年
7 杨丽萍;基于语料库的英语专业大学生议论文限时写作中的四字词块研究[D];江西师范大学;2010年
8 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年
9 黄洁;基于语料库的商务英语词汇特点的研究[D];大连海事大学;2010年
10 李艳梅;基于语料库的中国英语学习者与本族语者阐发性话语标记语的对比分析[D];沈阳师范大学;2011年
中国重要报纸全文数据库 前10条
1 PALADIN;算法中的NP问题[N];电脑报;2003年
2 ;机器人激活算法和程序设计教学[N];中国电脑教育报;2004年
3 记者 侯建华;会计所算了经济账又算法律账[N];重庆商报;2001年
4 汪蔚;用算法改变世界[N];中国计算机报;2008年
5 PALADIN;算法演义[N];电脑报;2003年
6 记者 雷敏 张旭东 刘铮;我国人均GDP仍在世界100位之后[N];新华每日电讯;2005年
7 H Q;改善照片VCD的制作效果[N];电脑报;2003年
8 南京 朱罕非;一种实用单片机多字节除法的算法[N];电子报;2004年
9 胡英;高安全行业应考虑SSL VPN算法[N];计算机世界;2007年
10 复旦大学国际政治系博士 沈逸;谷歌的权力与生意[N];东方早报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978