收藏本站
《计算机应用》 2008年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于规则挖掘和Nave Bayes方法的组合型歧义字段切分

张严虎  潘璐璐  彭子平  张靖波  于中华  
【摘要】:组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Nave Bayes模型综合决策进行组合型歧义字段切分。充分的实验表明,相对于文献中的研究结果,该算法对组合型歧义字段切分的准确率提高了大约8%。

【参考文献】
中国期刊全文数据库 前1条
1 冯素琴;陈惠明;;一种自组织的汉语组合型歧义消歧方法[J];计算机工程与设计;2007年03期
【共引文献】
中国硕士学位论文全文数据库 前1条
1 程冲;信息检索用汉语分词与未登录词识别技术研究[D];南京农业大学;2007年
【同被引文献】
中国期刊全文数据库 前10条
1 王鑫,王丁,李向宏;基于汉语分词的信息抽取技术[J];信息技术;2003年04期
2 胥桂仙,苏筱蔚,陈淑艳;中文文本挖掘中的无词典分词的算法及其应用[J];吉林工学院学报(自然科学版);2002年01期
3 李振星,徐泽平,唐卫清,唐荣锡;全二分最大匹配快速分词算法[J];计算机工程与应用;2002年11期
4 孙茂松,肖明,邹嘉彦;基于无指导学习策略的无词表条件下的汉语自动分词[J];计算机学报;2004年06期
5 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
6 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
7 黄德根,岳广玲,杨元生;基于统计的中文地名识别[J];中文信息学报;2003年02期
8 梁刚;基于机械分词与统计学的新词识别研究[J];情报理论与实践;2005年05期
9 张培颖;李村合;;一种中文分词词典新机制——四字哈希机制[J];微型电脑应用;2006年10期
10 秦秀白;网语和网话[J];外语电化教学;2003年06期
中国硕士学位论文全文数据库 前4条
1 代建英;汉语自动分词系统的研究与实现[D];重庆大学;2005年
2 杨彦;基于Hash结构的机械统计分词系统[D];中南大学;2005年
3 蔡灿民;基于词典的智能分词系统的研究与实现[D];昆明理工大学;2008年
4 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
【二级参考文献】
中国期刊全文数据库 前5条
1 肖云,孙茂松,邹嘉彦;利用上下文信息解决汉语自动分词中的组合型歧义[J];计算机工程与应用;2001年19期
2 谭琼,史忠植;分词中的歧义处理[J];计算机工程与应用;2002年11期
3 郑德权,于凤,王开涛 ,赵铁军;基于汉语二字应成词的歧义字段切分方法[J];计算机工程与应用;2003年01期
4 苏菲,王丹力,戴国忠;基于标记的规则统计模型与未登录词识别算法[J];计算机工程与应用;2004年15期
5 曾华琳,李堂秋,史晓东;一种基于提取上下文信息的分词算法[J];计算机应用;2005年09期
中国重要会议论文全文数据库 前1条
1 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 李堂秋;用大规模并行网络模型同时解决中文分词和语法分析[J];厦门大学学报(自然科学版);1990年02期
2 黄居仁,陈克健,陈凤仪,魏文真,张丽丽;《资讯处理用中文分词规范》设计理念及规范内容[J];语言文字应用;1997年01期
3 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期
4 钟涛,陈新明,万钧,张世永;中文文本WEB搜索引擎的设计与实现[J];计算机工程与应用;2001年17期
5 丁承,邵志清;基于字表的中文搜索引擎分词系统的设计与实现[J];计算机工程;2001年02期
6 王靖,肖明君,蔡庆生;一种基于Web的智能搜索方法[J];计算机应用研究;2001年11期
7 李志蜀,李果;中文搜索引擎的原理剖析及开发实现技术[J];计算机应用研究;2001年11期
8 陈红英,李卫华;智能信息Agent的原理和实现方法[J];计算机系统应用;2001年11期
9 张红娟;自然语言查询技术的研究与应用[J];微电脑世界;2001年17期
10 陈红英,李卫华;智能信息Agent的研究和实现[J];计算机工程与应用;2002年12期
中国重要报纸全文数据库 前10条
1 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
2 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
3 丁鸿;百度掀起财富浪潮 中国互联网不再“青涩”[N];中国工业报;2005年
4 王翌;互联网2005:个性化生存[N];计算机世界;2005年
5 清华大学IT可用性实验室;2005中文搜索引擎质量对比[N];计算机世界;2005年
6 王宾;加速争夺中国搜索市场[N];北京商报;2006年
7 贺俊;汇聚亿万草根智慧 奇虎发布经验搜索[N];证券日报;2006年
8 高雪娟;企业搜索要为决策服务[N];中国计算机报;2006年
9 姜蕊;过半用户难辨百度雅虎[N];中国商报;2006年
10 张磊;雅虎加速争夺在华市场[N];中华工商时报;2006年
中国博士学位论文全文数据库 前2条
1 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
2 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
2 陈红英;Internet信息过滤Agent的研究和实现[D];广东工业大学;2002年
3 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年
4 胡蓉;中文Web文档倾向性自动分类研究[D];四川大学;2003年
5 刘琨;搜索引擎的研究与实现[D];西安电子科技大学;2004年
6 赵海雁;基于数据链路层数据捕获与信息过滤[D];华北工学院;2004年
7 许彦彬;基于Java技术的生物资源专业搜索引擎的研究与开发[D];昆明理工大学;2004年
8 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
9 于爱军;NERMS中基于Internet的搜索引擎研究与实现[D];吉林大学;2004年
10 杨凤芹;建立层次结构用户兴趣模型的方法[D];东北师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026