收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

有限状态机在中文文本分词中的应用

火善栋  
【摘要】:提出并实现一种有限状态机算法,该方法结合二分查找树算法将整个词典构造成一个有限状态机,从而使词典中的每个不同的汉字以不同弧权值的形式存在于有限状态机中。当要判断某个字符串是不是词时,只要从这个有限状态机的第一个状态结点依次进行查找即可。实验显示,通过这个有限状态机词典可以实现对字符串的快速查找。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴成富;张江霞;段晓军;陈楸;;余度飞控软件单PC仿真测试技术[J];测控技术;2011年08期
2 邹北骥;孟志刚;向遥;曾羽;;实时双向群组搜索及其在蚁群觅食动画中的应用[J];小型微型计算机系统;2011年06期
3 杨撼岳;陈笑蓉;郑高山;;水族文字笔形编码方法研究[J];计算机工程;2011年14期
4 彭成;季培培;;基于确定性退火的中文术语语义层次关联研究[J];计算机应用研究;2011年09期
5 詹瑾瑜;陈忠湘;郝宗波;;基于有限状态机的指针解引用静态检测方法[J];四川大学学报(工程科学版);2011年04期
6 张野;杨建林;;基于KNN和SVM的中文文本自动分类研究[J];情报科学;2011年09期
7 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
8 万华根;肖海英;邹松;;面向新一代大众游戏的手势交互技术[J];计算机辅助设计与图形学学报;2011年07期
9 顾潇华;姜亦强;崔涛;;中文自动标引、全文检索及中文搜索引擎三者关系的探讨[J];图书馆学研究;2011年17期
10 张尊生;;《信息技术 信息交换用汉字编码字符集 基本集的扩充》和《信息技术 数字键盘汉字输入通用要求》国家标准发布[J];中国标准导报;2000年03期
11 赵晓凡;胡顺义;刘永革;;CRF模型中参数f在字标注汉语分词中的适用性研究[J];郑州大学学报(工学版);2011年04期
12 程桂花;齐学梅;罗永龙;;AES算法中模逆运算电路设计与实现[J];小型微型计算机系统;2011年06期
13 申兵一;巩青歌;;中文分词技术在搜索引擎中的应用研究[J];计算机与网络;2010年01期
14 谭魏璇;孔芳;倪吉;周国栋;;基于混合统计模型的中文基本名词短语识别[J];计算机应用与软件;2011年08期
15 李晓庆;崔健;蔡立志;;基于UML状态图的软件测试研究[J];计算机工程;2011年18期
16 于江德;谷川;葛文英;樊孝忠;;一种基于字和子串联合标注的汉语分词方法[J];山西大学学报(自然科学版);2011年03期
17 吕方瑶;;当前主要网络仿真工具研究和实践[J];信息通信;2011年04期
18 路纲;刘侍刚;;软件体系架构案例教学:连珠软件开发[J];计算机教育;2011年16期
19 朱渊萍;;一种新的时间序列相似性模式发现算法[J];海南师范大学学报(自然科学版);2011年02期
20 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期
中国重要会议论文全文数据库 前10条
1 李炜;吴建国;刘政怡;;非完全确定有限状态机最小闭覆盖的有效算法[A];第四届中国软件工程大会论文集[C];2007年
2 李炜;许中卫;刘政怡;刘露露;;非完全确定有限状态机最小化有效算法的研究[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 王宗义;;有限状态机原理在OA系统中的运用[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
4 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
5 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
6 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
8 刘晓明;赖祥;黄松;;一种基于邻接矩阵的有限状态机路径产生方法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
9 李竹;;中文信息处理与现代汉语词类研究[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
10 张剑鸣;杨正球;;基于Struts架构的考核系统软件的设计[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 李小将;Client/Server系统的软件测试技术研究[D];西北工业大学;2002年
2 金虎;自动化软件测试技术研究[D];四川大学;2006年
3 范年柏;程序正确性验证的几个问题[D];湖南大学;2005年
4 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
5 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
6 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年
7 李晓军;基于量子框架的开放式汽车电控系统体系架构及其应用研究[D];山东大学;2008年
8 吕新桥;联机手写汉字识别技术研究[D];华中科技大学;2009年
9 梁添才;基于认知机理的汉字智能造字研究[D];华南理工大学;2008年
10 吕庆聪;普适计算语义服务发现与服务组合研究[D];东华大学;2009年
中国硕士学位论文全文数据库 前10条
1 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
2 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
3 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
4 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
5 董刚;基于自主智能体的群体动画创作方法研究与实现[D];国防科学技术大学;2004年
6 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
7 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
8 徐瑞;一个中文语义语料库的研究与建设[D];苏州大学;2006年
9 沈威;基于渡越矩阵与语境计算模型的复句关系词的自动标注[D];华中师范大学;2007年
10 罗丽俊;中文信息处理中若干技术的研究与实现[D];辽宁科技大学;2008年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
4 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
5 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
6 许伟;金友兵 破局国外办公套件垄断[N];中国企业报;2008年
7 ;浙江天宇信息技术有限公司[N];中国计算机报;2009年
8 广东省电信科学技术研究院多媒体部 张宇飞 卢燕青;实时系统软件分析和设计方法综述[N];中国计算机报;2000年
9 中文信息学会课题组;如何提高国产手机汉字输入法的市场竞争力[N];语言文字周报;2007年
10 梵欣;两项信息技术国家标准发布[N];中国包装报;2000年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978