收藏本站
《鞍山师范学院学报》 2008年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

正向最大匹配法在中文分词技术中的应用

胡锡衡  
【摘要】:分词是中文信息处理的一部分,分词本身并不是目的,而是后续处理过程的必要阶段,是中文信息处理的基础技术.正向最大匹配法是一种基于词典的分词方法,它能够有效地实现对中文文档的扫描,将文档分解成为词的集合.从而实现中文文本结构化的表示.
【作者单位】鞍山师范学院数学系
【分类号】:TP391.1

【参考文献】
中国期刊全文数据库 前2条
1 孙茂松,左正平,黄昌宁;汉语自动分词词典机制的实验研究[J];中文信息学报;2000年01期
2 唐培丽,胡明,张勇;基于中文文本主题提取的分词方法研究[J];吉林工程技术师范学院学报;2005年02期
【共引文献】
中国期刊全文数据库 前10条
1 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
2 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
3 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
4 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
5 胡正微;;人脑输入汉语文本识别分词时的假象分析[J];长沙理工大学学报(社会科学版);2006年03期
6 吴登堂;关于字母词的思考——兼谈中文信息处理对字母词自动切分的构想[J];丹东师专学报;2003年02期
7 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
8 吴静,蔡砥,王铮;地理信息系统中自然语言查询的分词处理与应用[J];地球信息科学;2005年03期
9 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
10 刘晓英;汉语自动分词研究的发展趋势[J];高校图书馆工作;2005年04期
中国重要会议论文全文数据库 前10条
1 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
2 吴晶晶;荆继武;王平建;;一种基于词典的新型中文分词机制[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
3 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 陶建华;蔡莲红;赵晟;;汉语语音合成中的文本分析和韵律处理[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 李江波;周强;陈祖舜;;汉语词典快速查询算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 杨超;李仁发;蒋斌;;一种高效的汉语自动分词词典机制[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 李斌;陈小荷;方芳;徐艳华;;高频最大交集型歧义字段问题研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 何婷婷;语料库研究[D];华中师范大学;2003年
2 张蕾;概念结构及其应用[D];西北工业大学;2001年
3 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
4 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
5 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
6 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
7 乔林;基于多关键词检索的企业竞争情报搜集方法研究[D];中国科学技术大学;2006年
8 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 朴点熙;七种汉语教材选词分析[D];北京语言文化大学;2000年
2 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
3 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
4 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
5 刘向辉;专题性智能搜索引擎的研究与实现[D];昆明理工大学;2001年
6 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
7 黄艳;面向数字化产品的自然语言查询技术的研究与开发[D];浙江大学;2002年
8 缪晓阳;WebCM:一种基于搜索引擎的网络内容监控系统的研究[D];浙江大学;2002年
9 王鲲;多智能体并行设计环境中自然语言通信功能的研究[D];中南大学;2002年
10 李丽苹;教学电子信息资源管理研究[D];南京师范大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 牛继舜;网络营销的顾客服务方式[J];情报杂志;2005年11期
2 马哲,姚敏;一种改进的基于PATRICIA树的汉语自动分词词典机制[J];华南理工大学学报(自然科学版);2004年S1期
3 杨文峰,陈光英,李星;基于PATRICIA tree的汉语自动分词词典机制[J];中文信息学报;2001年03期
4 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
5 冯素琴;陈惠明;;利用上下文信息解决汉语组合型歧义[J];电脑开发与应用;2007年01期
6 唐培丽,胡明,张勇;基于中文文本主题提取的分词方法研究[J];吉林工程技术师范学院学报;2005年02期
7 胡涛;路红英;;基于Nutch的搜索引擎的研究[J];计算机时代;2007年01期
8 马玉春,宋瀚涛;Web中文文本分词技术研究[J];计算机应用;2004年04期
9 冯素琴;陈惠明;;一种自组织的汉语组合型歧义消歧方法[J];计算机工程与设计;2007年03期
10 胡文英;祖漪清;王志中;;语句的基频曲线预测[J];声学学报(中文版);2006年01期
中国重要会议论文全文数据库 前1条
1 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前4条
1 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
2 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
3 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
4 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
中国硕士学位论文全文数据库 前10条
1 张思光;韵律文本驱动的三维口型动画研究[D];北京工业大学;2008年
2 张敏;基于Internet的个性化信息检索关键技术研究[D];燕山大学;2006年
3 吴卓斌;基于LUCENE全文搜索引擎关键技术的研究[D];暨南大学;2007年
4 赵鹏;基于数据压缩的信息检索技术的研究[D];黑龙江大学;2002年
5 司建军;油田信息网信息检索技术研究与应用[D];哈尔滨工程大学;2002年
6 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
7 黄羽;基于智能体技术的入侵检测系统及相关技术研究[D];电子科技大学;2003年
8 周江卫;数字学位论文系统的研究与开发[D];西安电子科技大学;2003年
9 程俊春;基于构件的软件集成研究[D];武汉大学;2004年
10 张滨;中文文档分类技术研究[D];武汉大学;2004年
【二级参考文献】
中国期刊全文数据库 前6条
1 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
2 湛燕,陈昊,袁方,王熙照;基于中文文本分类的分词方法研究[J];计算机工程与应用;2003年23期
3 孙茂松,左正平,黄昌宁;汉语自动分词词典机制的实验研究[J];中文信息学报;2000年01期
4 许建潮,胡明,时密林;文书类档案的主题标引研究[J];情报学报;1998年04期
5 郭辉,苏中义,王文 ,崔骏;一种改进的MM分词算法[J];微型电脑应用;2002年01期
6 孙茂松,邹嘉彦;汉语自动分词研究中的苦干理论问题[J];语言文字应用;1995年04期
【相似文献】
中国期刊全文数据库 前10条
1 玉素甫·艾白都拉;张海军;艾孜尔古丽;;信息处理用现代维吾尔语词干词类标记集研究[J];信息技术与标准化;2011年06期
2 赵志军;沈强;唐晖;方旭明;;物联网架构和智能信息处理理论与关键技术[J];计算机科学;2011年08期
3 苏惠明;孙姜燕;谢勇;;基于E-learning的煤炭学院信息处理考试系统[J];煤炭技术;2011年09期
4 ;微软公司[J];物联网技术;2011年05期
5 张俊华;;电销车险CIM系统的设计与实现[J];硅谷;2011年12期
6 刘军;;基于物联网的仓储管控一体化系统设计策略[J];物流技术;2011年15期
7 王琳;杜莉萍;;数字语言实验室的建设与管理[J];发展;2011年08期
8 陆建军;;ERP在会计领域中的应用[J];金融经济;2005年18期
9 孙萌;;简析旅店信息管理系统应用的必然性[J];华章;2011年15期
10 丁四成;;用Excel开发MIS(管理信息系统)的方法[J];宿州教育学院学报;2011年03期
中国重要会议论文全文数据库 前10条
1 曹海旺;薛朝改;黄建国;王汝夯;;一体化水下对抗仿真环境的设计与实现[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
2 王红霞;田涛;徐海波;赵云芳;;基于分数傅里叶变换相关的光学图像识别研究[A];第六届全国信息获取与处理学术会议论文集(3)[C];2008年
3 牛占军;华钢;;PLC控制的信集闭系统软件设计[A];第十七届全国煤矿自动化学术年会、中国煤炭学会自动化专业委员会学术会议论文集[C];2007年
4 王玉林;;图像和视频水印:可能性和不可能性[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
5 鲍焕军;郑方;;GMM-UBM和SVM说话人辨认系统及融合的分析[A];第九届全国人机语音通讯学术会议论文集[C];2007年
6 李鹏;徐波;;单词自动注音方法的研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
7 多拉;扎西加;欧珠;大罗桑朗杰;;信息处理用藏文词类及标记集规范(征求意见稿)[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 孙茂松;王洪君;董秀芳;;《信息处理用现代汉语分词词表》规范[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 宝金良;;蒙古文文本标点符号及其属性字段设置[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
10 王士进;孟猛;梁家恩;徐波;;基于Multilingual的音素识别及其在语种识别中的应用[A];第九届全国人机语音通讯学术会议论文集[C];2007年
中国重要报纸全文数据库 前10条
1 王玉珍;图书管理系统浅议[N];莱芜日报;2006年
2 吴勇毅;信息化一对一:OA&协同[N];中国计算机报;2008年
3 冯晓芳;我国计算机技术亟待解决海量信息处理问题[N];中国质量报;2006年
4 侯涛;视频搜索: 2006搜索关键词[N];计算机世界;2006年
5 东北财经大学会计学院 王振武;会计信息化的三个发展阶段[N];财会信报;2007年
6 青岛市委市政府计算机中心 张理敬;“三网”划分电子政务网络[N];计算机世界;2007年
7 毕金玲;XBRL 可扩展商业报告语言[N];财会信报;2007年
8 北京信息与控制研究所 王正中;仿真学科的研究与思考[N];大众科技报;2007年
9 郑艳霞 刘美丽;ERP在中国的遭遇[N];财会信报;2008年
10 万明秀;创新成就小企业梦想[N];中国黄金报;2007年
中国博士学位论文全文数据库 前7条
1 苏金泷;敏捷企业集成基础结构中的若干关键技术研究[D];上海大学;2008年
2 童庆;面向基因预测的信息处理方法研究[D];中国科学技术大学;2006年
3 熊云波;文本信息处理的若干关键技术研究[D];复旦大学;2006年
4 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
5 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
6 顾祥柏;流程工业信息基元集成方法及应用研究[D];北京化工大学;2005年
7 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
中国硕士学位论文全文数据库 前10条
1 夏晓琼;基于J2EE架构的高校文档信息处理系统[D];山东大学;2005年
2 朱新利;驾培管理系统信息化的研究[D];湖南大学;2006年
3 白如江;数字图书馆智能导航系统分析、设计与实现[D];山东理工大学;2008年
4 郑传文;光电装备综合信息处理研究[D];南京理工大学;2008年
5 贾琨;基于数据挖掘技术的交通信息处理与分析系统[D];山东师范大学;2005年
6 王亮;Agent技术在集装箱码头管理系统中的应用[D];大连理工大学;2007年
7 王莹莹;中文短语相似度计算方法研究及应用[D];长沙理工大学;2008年
8 王博;无人侦察直升机信息处理与传输系统[D];国防科学技术大学;2004年
9 宋剑波;电力数据网短信告警监测及存储系统[D];贵州大学;2008年
10 刘兴伟;油田动静态信息查询系统[D];大庆石油学院;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026