收藏本站
《计算机应用》 2006年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于贝叶斯算法的中国人名识别

周波  杨国纬  
【摘要】:在常规的使用概率统计人名方法的基础上,提出了使用贝叶斯分类法识别句子中中国人名的方法。通过使用贝叶斯分类算法计算汉字串分别成为中国人名的概率和成为非中国人名的概率,可以有效地识别出汉语句子中的中国人名。该方法的识别公式简单,并且具有一定的学习能力,在与其他一些辅助技术结合起来的情况下,可以获得比较好的中国人名识别效果。

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 乔永波;规则与统计相结合的中文命名实体识别[D];山东大学;2007年
【参考文献】
中国期刊全文数据库 前5条
1 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
2 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期
3 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
4 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
5 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
【共引文献】
中国期刊全文数据库 前10条
1 张滨,晏蒲柳,李文翔,夏德麟;基于汉语句模的中文分词算法[J];计算机工程;2004年01期
2 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期
3 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
4 张云涛,龚玲,王永成;面向自然语言提问的检索技术[J];广西师范大学学报(自然科学版);2003年01期
5 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
6 余祖波;高庆狮;方淼;;中文姓名自动识别系统的设计与实现[J];计算机工程与应用;2006年10期
7 毋琳;郑逢斌;乔保军;汤赛丽;;HENU汉语分词系统中的中文人名识别算法[J];计算机工程与应用;2006年14期
8 王源媛;何中市;;基于词性探测的中文姓名识别算法[J];计算机科学;2005年04期
9 黄德根;孙迎红;;中文地名的自动识别[J];计算机工程;2006年03期
10 周蕾;朱巧明;;基于统计和规则的未登录词识别方法研究[J];计算机工程;2007年08期
中国重要会议论文全文数据库 前10条
1 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
2 刘俊;张益肇;;基于统计的中文姓名提取方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
3 于传武;李生;陈鄞;赵铁军;;基于混合策略的汉语未登录词整体识别[A];第一届学生计算语言学研讨会论文集[C];2002年
4 雷静;;汉语机构名的构成模式[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 那顺乌日图;雪艳;淑琴;敖日格乐;;蒙古文人名自动识别研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 刘桐菊;于浩;赵铁军;;基于标引技术的特定领域XML文本自动生成[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
8 钱小飞;陈小荷;董宇;何晓丽;;面向大型叙事作品的指人成分识别[A];第三届学生计算语言学研讨会论文集[C];2006年
9 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
10 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前8条
1 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
2 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
3 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
5 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
6 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
7 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
8 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 毛红宇;垃圾邮件过滤算法研究与实现[D];上海交通大学;2007年
2 王刚;连词“和”的自动识别规则研究[D];上海师范大学;2007年
3 程冲;信息检索用汉语分词与未登录词识别技术研究[D];南京农业大学;2007年
4 朱丽丽;基于类比学习的人名识别方法研究[D];山西大学;2007年
5 齐波;基于自然语言理解的智能搜索方法研究[D];重庆大学;2007年
6 刘婷;中文自动分词法在全文检索中的研究及应用[D];南京航空航天大学;2007年
7 李方圆;基于决策树的邮件分类技术研究[D];湖南师范大学;2007年
8 武玉洲;汉语文本人名识别改进方法研究[D];北京语言大学;2007年
9 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
10 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
2 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
3 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
4 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期
5 苏菲,王丹力,戴国忠;基于标记的规则统计模型与未登录词识别算法[J];计算机工程与应用;2004年15期
6 谭红叶,郑家恒,刘开瑛;中国地名自动识别系统的设计与实现[J];计算机工程;2002年08期
7 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
8 郑家恒,张辉;基于HMM的中国组织机构名自动识别[J];计算机应用;2002年11期
9 李卫红,万建成;书面汉语全切分算法中的并发检索模型[J];计算机应用;2004年05期
10 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
【二级参考文献】
中国期刊全文数据库 前5条
1 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
2 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
3 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
4 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
5 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
中国重要会议论文全文数据库 前1条
1 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 刘源,梁南元;汉语处理的基础工程——现代汉语词频统计[J];中文信息学报;1986年01期
2 梁南元;书面汉语自动分词综述[J];计算机应用与软件;1987年03期
3 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
4 王永成,李健;汉语的自动分词[J];上海交通大学学报;1989年02期
5 赵福君,黄厚宽,俞经善;基于期望的汉语分词模型的设计[J];哈尔滨工程大学学报;1990年02期
6 戴明坚;张大方;;书面汉语自动分词技术与实现[J];计算技术与自动化;1990年03期
7 李强,李侯润;半自动分词技术[J];计算机工程与设计;1992年01期
8 李秀志;书面汉语自动分词方法研究[J];微型机与应用;1993年07期
9 张琪玉;;人-机结合的题内关键词索引可回避汉语分词难题[J];图书馆杂志;1993年04期
10 吴胜远;多级内码理论及应用效果[J];微电脑世界;1995年09期
中国重要会议论文全文数据库 前10条
1 贺前华;徐秉铮;;神经网络在汉语自动分词中的应用[A];第二届全国人机语音通讯学术会议论文集[C];1992年
2 付国宏;王晓龙;龚永红;;基于词形的汉语文本切分方法[A];第五届全国人机语音通讯学术会议论文集[C];1998年
3 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 陈鄞;赵铁军;吕雅娟;于浩;;汉英机器翻译中数词的识别和翻译[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
5 于传武;李生;陈鄞;赵铁军;;基于混合策略的汉语未登录词整体识别[A];第一届学生计算语言学研讨会论文集[C];2002年
6 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
7 傅思泉;;机器词典中按韵分词及虚词问题[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
8 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 李晶;陈鄞;杨沐昀;徐冰;;关于在分词系统中引入领域词典的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 曹娟;周经野;;隐式分词连写输入方法——解决汉语分词问题的根本途径[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前1条
1 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
中国博士学位论文全文数据库 前1条
1 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前9条
1 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
2 陈先华;自然语言理解之汉语量词和名词搭配及查错系统[D];电子科技大学;2002年
3 冯蜀茗;网络环境下协作学习监控研究[D];西南师范大学;2005年
4 王红雨;网络教学汉语答疑系统关键技术的研究与应用[D];大连理工大学;2006年
5 周波;汉语语言处理中专有名词的提取和识别[D];电子科技大学;2006年
6 郭翠珍;基于网格的分词服务系统的研究与实现[D];苏州大学;2006年
7 李楠;基于遗传算法的汉语文本主题词提取研究[D];吉林大学;2007年
8 于长远;应用条件随机场进行汉语分词和词性标注的研究[D];辽宁科技大学;2008年
9 沈勤中;基于条件随机场的汉语分词研究[D];苏州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026