收藏本站
《安阳师范学院学报》 2010年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

中文分词技术综述

周宏宇  张政  
【摘要】:中文分词是中文信息处理的基础,分词系统也是中文信息处理中的一个主要组成部分,对中文文本的分词处理目前已经应用到了中文自然语言理解、文献检索、搜索引擎以及文本挖掘系统等领域。本文对现有的中文分词技术进行了综述,分析了现有分词方法的技术特点,指出了部分分词方法存在的优缺点。
【作者单位】安阳师范学院;
【分类号】:TP391.1

【引证文献】
中国期刊全文数据库 前1条
1 万莛;;最大匹配算法研究[J];微型机与应用;2012年08期
中国硕士学位论文全文数据库 前10条
1 刘飞荣;SOM算法的改进及其在中文文本聚类的应用[D];南昌大学;2010年
2 胡少荣;一种舆情信息预处理平台的研究与实现[D];北京交通大学;2010年
3 吕靖;互联网搜索词分类关键技术研究[D];浙江大学;2011年
4 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年
5 王慧;最大熵模型的语义句法分析在问答系统中的应用研究[D];大连交通大学;2010年
6 戚学磊;基于Lucene的站内搜索引擎技术的研究与应用[D];太原理工大学;2011年
7 石安磊;基于文本相似度评分的中医案例分析系统研究与实现[D];西北大学;2011年
8 冯鸥鹏;垃圾短信过滤中字特征与词特征对过滤效果的比较研究[D];北京邮电大学;2011年
9 梁文超;模糊规则算法在教育信息分类中的应用[D];南京师范大学;2011年
10 沈麒;基于校园网的用户行为分析系统的设计与实现[D];苏州大学;2011年
【参考文献】
中国期刊全文数据库 前2条
1 刘春辉;金顺福;刘国华;李颖;;基于优化最大匹配与统计结合的汉语分词方法[J];燕山大学学报;2009年02期
2 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
【共引文献】
中国期刊全文数据库 前10条
1 李国和;刘光胜;吴卫江;孙红军;唐先明;韩宝东;;基于最大匹配和歧义检测的中文分词粗分方法[J];北京信息科技大学学报(自然科学版);2010年S2期
2 刘春辉;金顺福;刘国华;李颖;;基于优化最大匹配与统计结合的汉语分词方法[J];燕山大学学报;2009年02期
3 瞿锋;陈纪元;;汉语自动分词算法综述[J];福建电脑;2006年04期
4 李国和;刘光胜;秦波波;吴卫江;李洪奇;;综合最大匹配和歧义检测的中文分词粗分方法[J];计算机工程与应用;2012年14期
5 刘汉兴;朱梅阶;刘财兴;林旭东;;基于词图的最大概率分词方法[J];计算机工程与设计;2008年24期
6 张彩琴;袁健;;改进的正向最大匹配分词算法[J];计算机工程与设计;2010年11期
7 罗晟;;号码百事通文本搜索引擎设计及优化对策[J];武汉理工大学学报;2009年24期
8 魏莎莎;熊海灵;;中文分词中的歧义识别处理策略[J];微计算机信息;2010年30期
9 王洪伟;霍佳震;王伟;廖雅国;;面向语义检索应用的本体模型结构设计[J];系统工程与电子技术;2010年01期
10 朱巧明;温滔;李培蜂;钱培德;;一种基于多元信息库的自适应汉语歧义切分方法[J];小型微型计算机系统;2006年08期
中国博士学位论文全文数据库 前3条
1 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
2 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
3 朱文浩;基于三维人脸特征的计算机辅助疾病诊断技术研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 张盛蕾;基于Java的浙江纺织服装学院校园网搜索引擎[D];电子科技大学;2010年
2 林冬盛;中文分词算法的研究与实现[D];西北大学;2011年
3 林捷;主题网络爬虫的研究和实现[D];武汉理工大学;2011年
4 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
5 沈麒;基于校园网的用户行为分析系统的设计与实现[D];苏州大学;2011年
6 徐辰;基于主题分类特征的物业评论情感分析[D];苏州大学;2011年
7 梅丹;基于信息安全领域本体的语义搜索引擎的设计与实现[D];华东理工大学;2012年
8 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
9 刘宽;现代汉语自动分词歧义分析及其消歧处理研究[D];兰州理工大学;2006年
10 王思力;面向大规模信息检索的中文分词技术研究[D];中国科学院研究生院(计算技术研究所);2006年
【同被引文献】
中国期刊全文数据库 前10条
1 丁俊苗;;不足与需要:论标点符号的语法功能[J];安徽大学学报(哲学社会科学版);2008年04期
2 秦学勇;;基于相似度计算的主观题阅卷系统设计[J];安徽建筑工业学院学报(自然科学版);2010年04期
3 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
4 张德鑫;“水至清则无鱼”——我的新生词语规范观[J];北京大学学报(哲学社会科学版);2000年05期
5 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
6 张仰森;曹元大;俞士汶;;最大熵方法中特征选择算法的改进与纠错排歧[J];北京理工大学学报;2006年01期
7 高影繁;马润波;刘玉树;;一种快速文本归类算法的设计与实现[J];北京理工大学学报;2006年12期
8 高军,陈锡先;无监督的动态分词方法[J];北京邮电大学学报;1997年04期
9 曾庆祥;廖建新;安宝贵;朱春梅;于川;;基于Lucene算法的移动终端资源搜索引擎研究与设计[J];北京工商大学学报(自然科学版);2008年05期
10 吴雁平,梁惠卿,黄嵘,李成;浅谈全文检索技术[J];档案管理;2000年06期
中国重要会议论文全文数据库 前1条
1 关毅;王晓龙;;基于统计的汉语词汇间语义相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前1条
1 彭岩 鄢琦;[N];计算机世界;2001年
中国博士学位论文全文数据库 前4条
1 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
2 鲁松;自然语言处理中词相关性知识无导获取和均衡分类器构建[D];中国科学院研究生院(计算技术研究所);2001年
3 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
4 宋玲;语义相似度计算及其应用研究[D];山东大学;2009年
中国硕士学位论文全文数据库 前10条
1 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
2 朱代华;基于分词技术的智能答疑系统[D];重庆大学;2004年
3 张磊;基于P2P的信息共享Agent研究[D];浙江大学;2005年
4 白广奇;网页内容过滤的关键技术研究及实现[D];山东大学;2005年
5 朱国华;文本信息处理中汉语句法分析方法研究[D];大连理工大学;2006年
6 徐丽;网络信息安全预警系统研究与设计[D];长安大学;2005年
7 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
8 魏振达;基于服务的元搜索引擎研究[D];南华大学;2006年
9 叶昭晖;网络信息雷达系统的研究与设计[D];国防科学技术大学;2005年
10 何淑芳;基于BBS文本信息的中文自动分词系统的研究[D];中国海洋大学;2006年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 吴世竞;垃圾短信过滤系统的设计与实现[D];北京邮电大学;2012年
2 张倩;弓形虫Rhomboid基因重组卡介苗的研制[D];吉林大学;2012年
3 张倩;教育信息垂直搜索引擎的研究[D];吉林大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
2 王东;陈笑蓉;;一种改进的高效分词词典机制[J];贵州大学学报(自然科学版);2007年04期
3 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期
4 郑德权,于凤,王开涛 ,赵铁军;基于汉语二字应成词的歧义字段切分方法[J];计算机工程与应用;2003年01期
5 朱鉴;张建;李淼;;一种有效解决汉语歧义切分的方法[J];计算机工程与应用;2007年11期
6 金瑜,陆启明,高峰;基于上下文相关的最大概率汉语自动分词算法[J];计算机工程;2004年16期
7 马玉春,宋瀚涛;Web中文文本分词技术研究[J];计算机应用;2004年04期
8 曾华琳,李堂秋,史晓东;一种基于提取上下文信息的分词算法[J];计算机应用;2005年09期
9 孙茂松,左正平,邹嘉彦;高频最大交集型歧义切分字段在汉语自动分词中的作用[J];中文信息学报;1999年01期
10 闫引堂,周晓强;交集型歧义字段切分方法研究[J];情报学报;2000年06期
【相似文献】
中国期刊全文数据库 前10条
1 张全;吴晨;韦向峰;;汉语句间成分共享类型及分布研究[J];计算机科学;2007年01期
2 张长利,赫枫龄,左万利;一种基于后缀数组的无词典分词方法[J];吉林大学学报(理学版);2004年04期
3 王磊,杨学良;图书馆检索系统及其汉语自动分词的实现[J];通信世界;1999年09期
4 李爽;;汉字输入数学模型的研究[J];中国科教创新导刊;2007年13期
5 蔡增玉;刘书如;张建伟;张保威;;汉字模糊有穷自动机的研究[J];计算机技术与发展;2008年03期
6 卢玉敏;;未登录名词短语识别现状初探[J];广西大学学报(自然科学版);2007年S1期
7 陈明远,管汀鹭;打字能比说话更快——几种高速键盘的设计[J];自然杂志;1980年08期
8 唐亚伟;亚伟中文速录机的诞生与应用[J];中文信息;1994年05期
9 胡宜课;信息高速公路与中文信息处理技术[J];计算机工程;1996年S1期
10 张俊林;曲为民;杜林;孙玉芳;;跨语言信息检索研究进展[J];计算机科学;2004年07期
中国重要会议论文全文数据库 前10条
1 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
2 乐明;冯志伟;;篇章修辞结构树库概述[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 乐明;冯志伟;;RST的理论发展和工程应用综述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
5 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
6 汪华峰;陈峪;;汉语自然语言理解中词切分中新词问题初探[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
7 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 俞士汶;王治敏;朱学锋;;文学语言与自然语言理解研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
10 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
4 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
5 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
6 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年
7 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
8 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年
9 本报记者 关逸民;中文速录成为自主核心技术产业[N];中国信息报;2006年
10 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
3 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
4 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
5 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
6 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
7 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
8 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
9 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
10 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年
中国硕士学位论文全文数据库 前10条
1 毋琳;特定领域问答系统中通用语义理解框架的设计与实现[D];河南大学;2007年
2 沈威;基于渡越矩阵与语境计算模型的复句关系词的自动标注[D];华中师范大学;2007年
3 秦健;N-gram技术在中文词法分析中的应用研究[D];中国海洋大学;2009年
4 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
5 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
6 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
7 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
8 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
9 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
10 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026