收藏本站
《计算机工程与应用》 2003年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于姓氏驱动的中国姓名自动识别方法

张仰森  徐波  曹元大  宗成庆  
【摘要】:文章基于姓氏驱动和上下文信息,利用从真实姓名样本库和文本语料库中得到的大量统计数据,提出了一种中国姓名识别的分级加权筛选模型,利用基于这一模型的识别算法和冲突解决策略,实现中国人名的自动识别。通过从《人民日报》随机抽取的500个含有人名的句子进行测试,表明:中国姓名召回率达89.2%,精确率达93.15%。

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 余祖波;高庆狮;方淼;;中文姓名自动识别系统的设计与实现[J];计算机工程与应用;2006年10期
2 毋琳;郑逢斌;乔保军;汤赛丽;;HENU汉语分词系统中的中文人名识别算法[J];计算机工程与应用;2006年14期
3 周波;杨国纬;;基于贝叶斯算法的中国人名识别[J];计算机应用;2006年04期
4 李成城,赵述芳,刘建毅,钟义信;基于动态规划算法的专有名词切分[J];计算机应用研究;2005年07期
中国重要会议论文全文数据库 前1条
1 钱小飞;陈小荷;董宇;何晓丽;;面向大型叙事作品的指人成分识别[A];第三届学生计算语言学研讨会论文集[C];2006年
中国硕士学位论文全文数据库 前6条
1 周波;汉语语言处理中专有名词的提取和识别[D];电子科技大学;2006年
2 李明;搭配距离在自动分词分句中的应用[D];电子科技大学;2006年
3 王志强;基于条件随机域的中文命名实体识别研究[D];南京理工大学;2006年
4 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
5 周文刚;基于语义的信息过滤算法及其应用[D];北方工业大学;2006年
6 乔永波;规则与统计相结合的中文命名实体识别[D];山东大学;2007年
【参考文献】
中国期刊全文数据库 前2条
1 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
2 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
【共引文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];当代语言学;1996年04期
3 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
4 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
5 杜永萍,郑家恒;分词及词性标注一致性校对系统的设计与实现[J];电脑开发与应用;2001年10期
6 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
7 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
8 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
9 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
10 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
中国重要会议论文全文数据库 前4条
1 马玉霞;黄德根;杨元生;;一种改进的中文姓名识别方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
3 赫琳;;论“X 从小 Y”的词切分——“从小”语义指向计算机识别的再思考[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
4 余军;陈晓鸥;;命名实体识别:One-at-a-time or All-at-once?Word-based or Character-based?[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张蕾;概念结构及其应用[D];西北工业大学;2001年
2 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
6 刘伟;现代汉语代词隐现的动态研究[D];北京语言大学;2005年
7 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
3 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
4 吴雪敏;汉语语句的计算机分析[D];电子科技大学;2001年
5 吴思;聚类分析及其在农业物种信息自动提取中的应用[D];湘潭大学;2001年
6 许勇;基于百科词典的知识获取系统的研究与实现[D];北京工业大学;2001年
7 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
8 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
9 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
10 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
【同被引文献】
中国期刊全文数据库 前10条
1 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
2 谭丹,鲜继清;基于NDIS hook的Windows防火墙驱动程序设计[J];重庆邮电学院学报(自然科学版);2005年05期
3 唐培丽,王树明,胡明;基于语义的汉语文献主题词提取算法研究[J];吉林大学学报(信息科学版);2005年05期
4 高泽胜,陶宏才;基于NDIS-HOOK技术的个人防火墙的研究与实现[J];成都信息工程学院学报;2004年03期
5 钱进;姓名用字的性别差异统计分析[J];常州工学院学报;2004年05期
6 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
7 张选芳;Internet网络安全的信息过滤模型分析[J];电子科技大学学报;2004年03期
8 黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期
9 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
10 王秀坤,李政,简幼良,刘剑;基于Hash方法的机器翻译词典的组织与构造[J];大连理工大学学报;1996年03期
中国重要会议论文全文数据库 前1条
1 王大禹;姚天顺;;使用一种半指导的学习机制识别中文未分词文本中的姓名(英文)[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 陈先华;自然语言理解之汉语量词和名词搭配及查错系统[D];电子科技大学;2002年
3 朱磊;自然语言处理之汉语文本自动校对[D];电子科技大学;2005年
4 乔羽;基于最大熵模型的中文人名识别方法研究[D];山西大学;2005年
5 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
6 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
7 王文迅;蛋白质名字识别系统的研究与实现[D];清华大学;2005年
8 杨德来;SVM和最大熵相结合的中文机构名自动识别[D];大连理工大学;2006年
9 陈霄;基于支持向量机的中文组织机构名识别[D];上海交通大学;2007年
10 何莉;基于Web信息抽取的个性化信息服务研究与实现[D];华东师范大学;2007年
【二级引证文献】
中国期刊全文数据库 前1条
1 贾品贵;杨一平;卢朋;;基于类向量模型的中文姓名识别研究[J];计算机应用研究;2007年04期
中国博士学位论文全文数据库 前1条
1 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前7条
1 周波;汉语语言处理中专有名词的提取和识别[D];电子科技大学;2006年
2 乔永波;规则与统计相结合的中文命名实体识别[D];山东大学;2007年
3 高凌;搜索算法与搜索引擎的研究与应用[D];武汉理工大学;2007年
4 王刚;连词“和”的自动识别规则研究[D];上海师范大学;2007年
5 朱丽丽;基于类比学习的人名识别方法研究[D];山西大学;2007年
6 覃张华;短文本语义过滤技术的研究[D];北方工业大学;2008年
7 王美方;信息过滤系统中特征选择算法的研究[D];山东师范大学;2008年
【二级参考文献】
中国期刊全文数据库 前1条
1 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
【相似文献】
中国硕士学位论文全文数据库 前1条
1 乔羽;基于最大熵模型的中文人名识别方法研究[D];山西大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026