收藏本站
《计算机应用研究》 2007年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于类向量模型的中文姓名识别研究

贾品贵  杨一平  卢朋  
【摘要】:提出了一种基于类向量模型的中文姓名识别方法。该方法通过类向量的生成来模拟人工识别姓名的过程,采用V iterbi算法对未经切分的汉字串进行类向量标注得到类向量序列,通过检查相邻类向量中类别和向量分量的变化来最终识别出人名。该方法是完全数据驱动的,不需要姓名识别的模式和规则。通过对互联网上随机抽取的1 000篇文章进行测试,结果表明,中文姓名识别召回率为82.2%,准确率为70.3%。

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 牛正雨,柴佩琪;文语转换系统中的中文姓名识别[J];计算机应用研究;2001年01期
2 李成城,赵述芳,刘建毅,钟义信;基于动态规划算法的专有名词切分[J];计算机应用研究;2005年07期
3 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
4 罗智勇,宋柔;一种基于可信度的人名识别方法[J];中文信息学报;2005年03期
【共引文献】
中国期刊全文数据库 前10条
1 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
2 胥桂仙,许建潮,连远锋,李昱翠;文本挖掘中的特征表示及聚类方法[J];吉林工学院学报(自然科学版);2002年03期
3 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期
4 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
5 毋琳;郑逢斌;乔保军;汤赛丽;;HENU汉语分词系统中的中文人名识别算法[J];计算机工程与应用;2006年14期
6 王源媛;何中市;;基于词性探测的中文姓名识别算法[J];计算机科学;2005年04期
7 熊文新;宋柔;;信息检索自然语言查询问句处理框架[J];计算机科学;2006年10期
8 靳从,唐振民,杨静宇;自动标引中中文姓名的切分[J];计算机工程;2003年22期
9 庄明,老松杨,吴玲达;一种统计和词性相结合的命名实体发现方法[J];计算机应用;2004年01期
10 李芳,盛焕烨,姚天昉;信息检索与信息抽取技术的研究[J];计算机应用研究;2002年01期
中国重要会议论文全文数据库 前7条
1 余军;陈晓鸥;;命名实体识别:One-at-a-time or All-at-once?Word-based or Character-based?[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
2 马玉霞;黄德根;杨元生;;一种改进的中文姓名识别方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
3 董宇;;称谓语与人名自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 郑泽之;张普;杨建国;;基于语料库的字母词语自动提取研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 钱小飞;陈小荷;董宇;何晓丽;;面向大型叙事作品的指人成分识别[A];第三届学生计算语言学研讨会论文集[C];2006年
6 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 张云涛;龚玲;王永成;;识别中文文本中的未登录专有名词的类别[A];2007年中国智能自动化会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
2 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
3 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
中国硕士学位论文全文数据库 前10条
1 王刚;连词“和”的自动识别规则研究[D];上海师范大学;2007年
2 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
3 朱丽丽;基于类比学习的人名识别方法研究[D];山西大学;2007年
4 刘婷;中文自动分词法在全文检索中的研究及应用[D];南京航空航天大学;2007年
5 潘景剑;具有中文人名识别功能的汉语自动分词算法研究[D];河北工业大学;2006年
6 武玉洲;汉语文本人名识别改进方法研究[D];北京语言大学;2007年
7 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
8 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
9 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
10 马东坡;Internet中文智能搜索引擎汉语自动分词系统设计[D];广西师范大学;2002年
【同被引文献】
中国期刊全文数据库 前5条
1 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
2 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
3 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
4 李斌;陈小荷;方芳;徐艳华;;基于语料库的高频最大交集型歧义字段考察[J];中文信息学报;2006年01期
5 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
【二级参考文献】
中国期刊全文数据库 前8条
1 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
2 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期
3 靳从,唐振民,杨静宇;自动标引中中文姓名的切分[J];计算机工程;2003年22期
4 王厚峰,戴大为;基于语料库句法结构分析的动态规划模型[J];计算机学报;1999年10期
5 牛正雨,柴佩琪;文语转换系统中的中文姓名识别[J];计算机应用研究;2001年01期
6 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
7 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
8 赵铁军,吕雅娟,于浩,杨沐昀,刘芳;提高汉语自动分词精度的多步处理策略[J];中文信息学报;2001年01期
【相似文献】
中国期刊全文数据库 前10条
1 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
2 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
3 王力红,杨剑,李洪,李云波,孙亚萍;汉语智能接口的自动分词研究[J];计算机工程;2001年08期
4 牛正雨,柴佩琪;文语转换系统中的中文姓名识别[J];计算机应用研究;2001年01期
5 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
6 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
7 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
8 王振华,孔祥龙,陆汝占,刘绍明;结合决策树方法的中文姓名识别[J];中文信息学报;2004年06期
9 余祖波;高庆狮;方淼;;中文姓名自动识别系统的设计与实现[J];计算机工程与应用;2006年10期
10 毋琳;郑逢斌;乔保军;汤赛丽;;HENU汉语分词系统中的中文人名识别算法[J];计算机工程与应用;2006年14期
中国重要会议论文全文数据库 前4条
1 马玉霞;黄德根;杨元生;;一种改进的中文姓名识别方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 王大禹;姚天顺;;使用一种半指导的学习机制识别中文未分词文本中的姓名(英文)[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
3 朱江涛;赵丽奎;蔡东风;;基于最大熵模型的中文姓名识别方法初探[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 张云涛;龚玲;王永成;;识别中文文本中的未登录专有名词的类别[A];2007年中国智能自动化会议论文集[C];2007年
中国硕士学位论文全文数据库 前8条
1 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
2 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
3 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
4 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
5 程越;基于统计的中文姓名识别的研究与实现[D];吉林大学;2005年
6 黄立冬;基础教育资源搜索引擎中的中文分词技术研究[D];南京师范大学;2006年
7 步海慧;基于最大熵模型的中文姓名识别研究[D];山东大学;2006年
8 朱江涛;中文信息处理中命名实体识别问题的研究[D];沈阳航空工业学院;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026