收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于类型论的汉语分词系统TTCS

高东平  
【摘要】:针对汉语分词中的未登录词识别和歧义消除这两个瓶颈问题和目前方法的不足,将类型论的思想引入到汉语分词领域中,提出了类型匹配模型,以类型论函数贴合为主要算法,融合了全切分、统计,前后缀识别信息等多种技术手段,将分词、未登录词识别、歧义消除,词典的动态扩充有机的融合到一个统一的理论模型当中。在此理论框架的基础上,最后实现了基于类型论的汉语分词系统TTCS。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 孙建军,陈肇雄,薛选民,郭喜林,侯敏;基于多功能逻辑运算分析技术的汉语分词[J];计算机研究与发展;1998年05期
2 张海营;;全二分快速自动分词算法构建[J];现代图书情报技术;2007年04期
3 尹锋;基于神经网络的汉语自动分词系统的设计与分析[J];情报学报;1998年01期
4 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
5 付国宏,王平,王晓龙;汉语分词和词性标注一体化分析的方法研究[J];计算机应用研究;2001年07期
6 王科,高常波,翟雪峰,罗万伯;汉语分词的主要技术及其应用展望[J];通信技术;2003年06期
7 火善栋;;有限状态机在中文文本分词中的应用[J];现代计算机(专业版);2010年06期
8 沈达阳,孙茂松,黄昌宁;汉语分词系统中的信息集成和最佳路径搜索方法[J];中文信息学报;1997年02期
9 翟伟斌;周振柳;蒋卓明;许榕生;;汉语分词词典设计[J];计算机工程与应用;2007年01期
10 马婷婷;;中文自动分词系统概述[J];电脑知识与技术;2010年33期
中国重要会议论文全文数据库 前10条
1 陈鄞;赵铁军;吕雅娟;于浩;;汉英机器翻译中数词的识别和翻译[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
2 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 王忠建;王玲;;一种汉语数字词典构筑的辅助方法[A];Proceedings of 2010 International Conference on Circuit and Signal Processing & 2010 Second IITA International Joint Conference on Artificial Intelligence(Volume 2)[C];2010年
4 李月伦;常宝宝;;基于最大间隔马尔可夫网模型的汉语分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 万升华;杨沐昀;李生;赵铁军;;基于字词混合翻译短语的统计机器翻译[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 郭晶;;一个基于汉语分词的搜索引擎原型系统[A];OA’2001办公自动化国际学术研讨会论文集[C];2001年
7 付国宏;王晓龙;龚永红;;基于词形的汉语文本切分方法[A];第五届全国人机语音通讯学术会议论文集[C];1998年
8 李双龙;刘乐中;刘群;;利用单字碎片过滤改进汉语分词性能[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 李晶;陈鄞;杨沐昀;徐冰;;关于在分词系统中引入领域词典的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前3条
1 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
2 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
3 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
中国硕士学位论文全文数据库 前10条
1 王红雨;网络教学汉语答疑系统关键技术的研究与应用[D];大连理工大学;2006年
2 周波;汉语语言处理中专有名词的提取和识别[D];电子科技大学;2006年
3 李楠;基于遗传算法的汉语文本主题词提取研究[D];吉林大学;2007年
4 王海;类型相异个体随机匹配模型在共有资源事务治理中的应用[D];南京理工大学;2004年
5 朱鸿宇;通过源程序检查发现缓冲区溢出漏洞[D];解放军信息工程大学;2004年
6 冯蜀茗;网络环境下协作学习监控研究[D];西南师范大学;2005年
7 郭翠珍;基于网格的分词服务系统的研究与实现[D];苏州大学;2006年
8 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
9 于长远;应用条件随机场进行汉语分词和词性标注的研究[D];辽宁科技大学;2008年
10 沈勤中;基于条件随机场的汉语分词研究[D];苏州大学;2008年
中国重要报纸全文数据库 前1条
1 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978