收藏本站
《中州大学学报》 2007年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于Perl的汉语自动分词算法研究

王巍  
【摘要】:汉语的自动分词是汉语语言处理的基础,本文讨论了汉语自动分词歧义问题的产生与分类,重点研究了交集型歧义字段的排歧策略,实现了一种基于Perl的汉语自动分词方法,在比较同种算法的VC++实现上,结果显示基于Perl的实现具有简洁和高效的优点。
【作者单位】北京航空航天大学自动化科学与电气工程学院
【分类号】:TP391.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 方利伟;个性化在线答疑系统的研究与实现[D];浙江师范大学;2007年
【参考文献】
中国期刊全文数据库 前1条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
中国硕士学位论文全文数据库 前1条
1 刘禹孜;汉语自动分词中排除歧义字段算法的研究[D];重庆大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
2 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
3 罗智勇;宋柔;;现代汉语通用分词系统中歧义切分的实用技术[J];计算机研究与发展;2006年06期
4 付德宇;代成琴;;一个面向文本分类的中文特征词自动抽取方法[J];计算机工程与应用;2006年15期
5 黄建中,王肖雷;Katz平滑算法在中文分词系统中的应用[J];计算机工程;2004年S1期
6 佘莉,符红光,方海光;几何命题处理中的中文分词技术[J];计算机工程;2005年18期
7 陈耀东,王挺;基于有向图的双向匹配分词算法及实现[J];计算机应用;2005年06期
8 徐华中;徐刚;;一种新的汉语自动分词算法的研究和应用[J];计算机与数字工程;2006年02期
9 杨尔弘;方莹;刘冬明;乔羽;;汉语自动分词和词性标注评测[J];中文信息学报;2006年01期
10 冯冲;陈肇雄;黄河燕;关真珍;;基于Multigram语言模型的主动学习中文分词[J];中文信息学报;2006年01期
中国博士学位论文全文数据库 前10条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
3 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
4 赵章界;短语结构制导的范畴表达式演算[D];中国科学院研究生院(计算技术研究所);2006年
5 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
6 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
7 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
8 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
9 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
10 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
2 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
3 王蕾;基于动态流通语料库的信息技术领域术语通用化研究[D];北京语言文化大学;2003年
4 许林杰;中文文本分词研究[D];山东师范大学;2003年
5 王丁;基于中文文本分类的自动诊病系统[D];哈尔滨理工大学;2003年
6 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
7 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
8 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
9 刘江;大规模汉语语料库分词一致性检验技术研究[D];山西大学;2005年
10 赵艳芳;面向Internet的个性化信息服务的研究[D];云南师范大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
2 李志辉;智能答疑系统中概念词典的设计与应用[J];重庆科技学院学报(社会科学版);2005年02期
3 彭喜化;黄睿;;基于向量空间模型的多关键字检索技术[J];重庆职业技术学院学报;2006年03期
4 程建钢,张国平,韩锡斌,马勃民;基于Web的远程答疑系统[J];电化教育研究;2002年07期
5 方青;国辛纯;洪锐;;TD-PSOLA算法对基音频率和时长的控制[J];电子测量技术;2006年06期
6 王理达;电子政务中中文文本分类技术的应用[J];大众科技;2005年01期
7 吴应良,韦岗,李海洲;一种基于N-gram模型和机器学习的汉语分词算法[J];电子与信息学报;2001年11期
8 吴耀中;TD-PSOLA技术在汉语语音波形编码合成中的应用[J];福建师范大学学报(自然科学版);1999年01期
9 唐焕玲,孙建涛,陆玉昌;文本分类中结合评估函数的TEF-WA权值调整技术[J];计算机研究与发展;2005年01期
10 张同珍,申瑞民;基于Web的自动答疑系统问题匹配算法研究与实现[J];计算机工程与应用;2003年29期
中国博士学位论文全文数据库 前1条
1 朱廷劭;数据挖掘及其在汉语文语转换中应用的研究[D];中国科学院研究生院(计算技术研究所);1999年
中国硕士学位论文全文数据库 前6条
1 单林娜;基于.NET的网上书店的设计与实现[D];重庆大学;2005年
2 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
3 李志辉;基于专业知网的中文智能答疑系统模型研究[D];西南大学;2006年
4 刘玮玮;搜索引擎中主题爬虫的研究与实现[D];南京理工大学;2006年
5 刘洁清;网站聚焦爬虫研究[D];江西财经大学;2006年
6 蒋科;基于领域概念定制的主题爬虫系统的设计与实现[D];西安电子科技大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
2 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期
3 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
4 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
5 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
6 梁南元,刘源,沈旭昆,谭强,杨铁鹰;制订《信息处理用现代汉语常用词词表》的原则与问题的讨论[J];中文信息学报;1991年03期
7 韩世欣,王开铸;基于短语结构文法的分词研究[J];中文信息学报;1992年03期
8 曹焕光,郑家恒;自动分词软件质量的评价模型[J];中文信息学报;1992年04期
9 徐秉铮,詹剑,贺前华;基于神经网络的分词方法[J];中文信息学报;1993年02期
10 沈达阳,孙茂松,黄昌宁;汉语分词系统中的信息集成和最佳路径搜索方法[J];中文信息学报;1997年02期
【相似文献】
中国期刊全文数据库 前10条
1 辛浩;;基于关联规则的中文姓名识别方法[J];宿州学院学报;2011年05期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 孙承杰;黄昌宁;关毅;;基于标注语料库的组合歧义检测与消解[A];第三届学生计算语言学研讨会论文集[C];2006年
3 黄昌宁;林娟;孙承杰;;何谓金本位[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 罗智勇;宋柔;荀恩东;;一种基于可信度的人名识别方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 李斌;陈小荷;;面向中文陌生文本的人机交互式分词方法[A];第三届学生计算语言学研讨会论文集[C];2006年
7 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 吴岩;蔺荪;;中文自动查错与人机交互纠错系统的研究与实现—简介语科中文自动校对系统[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 江荻;;藏语文本信息处理的历程与进展[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 程月;季娜;洪鹿平;;基于语料统计的以“不”开头双字分词不一致研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国重要报纸全文数据库 前1条
1 田梦;软件篇软件只是工具[N];计算机世界;2007年
中国博士学位论文全文数据库 前1条
1 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 许荣荣;中文文本自动分词技术与算法研究[D];郑州大学;2010年
2 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
3 刘宽;现代汉语自动分词歧义分析及其消歧处理研究[D];兰州理工大学;2006年
4 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
5 付蕾;知识元标引系统的设计与实现[D];华中师范大学;2009年
6 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
7 张敏;基于Internet的个性化信息检索关键技术研究[D];燕山大学;2006年
8 陈云;基于受限汉语和模块组合的自动程序设计研究[D];重庆大学;2008年
9 张敏;生物学文献的自动标引系统的研究与开发[D];东华大学;2006年
10 刘伟;基于限定领域的问句相似度[D];天津师范大学;2008年
中国知网广告投放
相关期刊
>宿州学院学报
相关机构
>合肥工业大学计算机与信息...
相关作者
>辛浩
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026