收藏本站
《中文信息学报》 1995年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

中文姓名的自动辨识

孙茂松  黄昌宁  高海燕  方捷  
【摘要】:中文姓名的辨识对汉语自动分词研究具有重要意义。本文提出了一种在中文文本中自动辨识中文姓名的算法。我们从新华通讯社新闻语料库中随机抽取了300个包含中文姓名的句子作为测试样本。实验结果表明,召回率达到了99.77%。

手机知网App
【引证文献】
中国期刊全文数据库 前10条
1 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];当代语言学;1996年04期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
4 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
5 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
6 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
7 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
8 王力红,杨剑,尹荧,李云波,孙亚萍;旅游信息数据库汉语智能接口的研究[J];计算机工程与应用;2002年01期
9 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期
10 王力红,杨剑,李洪,李云波,孙亚萍;汉语智能接口的自动分词研究[J];计算机工程;2001年08期
中国重要会议论文全文数据库 前10条
1 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 侯敏;侯敞;;汉英机译系统译文质量的评测[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
3 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
4 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
10 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
中国博士学位论文全文数据库 前6条
1 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
2 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
3 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
4 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
6 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
3 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
4 许勇;基于百科词典的知识获取系统的研究与实现[D];北京工业大学;2001年
5 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
6 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
7 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
8 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
9 王丁;基于中文文本分类的自动诊病系统[D];哈尔滨理工大学;2003年
10 骆彬;汉语新词语辅助识别系统的研制[D];中国社会科学院研究生院;2003年
【共引文献】
中国期刊全文数据库 前10条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
3 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
4 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期
5 应志伟,柴佩琪,陈其晖;文语转换系统中基于语料的汉语自动分词研究[J];计算机应用;2000年02期
6 牛正雨,柴佩琪;文语转换系统中的中文姓名识别[J];计算机应用研究;2001年01期
7 郭曙纶;汉语人名标注及其方法[J];零陵学院学报;2003年03期
8 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
9 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
10 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
中国重要会议论文全文数据库 前2条
1 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前2条
1 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
2 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
3 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
4 王丁;基于中文文本分类的自动诊病系统[D];哈尔滨理工大学;2003年
5 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
6 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
7 陈波;中文WEB文档自动分类的研究与实现[D];武汉理工大学;2005年
8 乔羽;基于最大熵模型的中文人名识别方法研究[D];山西大学;2005年
9 杨超;基于最大匹配的书面汉语自动分词研究[D];湖南大学;2004年
10 赵艳芳;面向Internet的个性化信息服务的研究[D];云南师范大学;2005年
【同被引文献】
中国期刊全文数据库 前10条
1 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
2 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
3 陈小荷;自动分词中未登录词问题的一揽子解决方案[J];语言文字应用;1999年03期
4 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
5 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
6 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
7 张跃,姚天顺;基于结合性自动识别中文姓名[J];小型微型计算机系统;1997年10期
8 沈达阳,孙茂松,黄昌宁;基于统计的汉语分词模型及实现方法[J];中文信息;1998年Z1期
9 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
10 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
中国重要会议论文全文数据库 前10条
1 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 张浩;刘群;白硕;;结构上下文相关的概率句法分析[A];第一届学生计算语言学研讨会论文集[C];2002年
4 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 柏晓静;常宝宝;詹卫东;吴拥华;;构建大规模的汉英双语平行语料库[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
6 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
7 王大禹;姚天顺;;使用一种半指导的学习机制识别中文未分词文本中的姓名(英文)[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
8 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 朱凯;周杰;何婷婷;;因特网语料自动下载分析软件的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
10 俞士汶;;计算语言学的应用研究与基础研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国博士学位论文全文数据库 前7条
1 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
2 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
3 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
4 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
5 曹玲;农业古籍数字化整理研究[D];南京农业大学;2006年
6 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
7 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
2 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
3 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
4 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
5 傅赛香;基于Internet的智能信息检索技术研究[D];广西师范大学;2002年
6 许林杰;中文文本分词研究[D];山东师范大学;2003年
7 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
8 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
9 梁以敏;基于统计的汉语词性标注方法的研究[D];大连理工大学;2004年
10 薛松;汉英平行语料库中名词短语对齐算法的研究[D];中国科学院研究生院(软件研究所);2003年
【二级引证文献】
中国期刊全文数据库 前10条
1 黄水清;程冲;;基于既定词表的自适应汉语分词技术研究[J];现代图书情报技术;2006年05期
2 罗宇辉,侯汉清;因特网经济学未登录词计算机辅助挖掘试验[J];情报理论与实践;2005年05期
3 潘卫东;WEB的数据挖掘[J];图书馆论坛;2004年01期
4 傅爱平;汉语信息处理中单字的构词方式与合成词的识别和理解[J];语言文字应用;2003年04期
5 刘华;;一种快速获取领域新词语的新方法[J];中文信息学报;2006年05期
6 许智坚;语料库语言学及其应用[J];龙岩师专学报;1997年02期
7 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
8 周蕾;;基于碎片分词的未登录词识别方法[J];常熟理工学院学报;2007年02期
9 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
10 罗智勇;宋柔;;现代汉语通用分词系统中歧义切分的实用技术[J];计算机研究与发展;2006年06期
中国重要会议论文全文数据库 前10条
1 许勇;宋柔;;基于百科词典的知识获取系统的研究与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
2 刘忠;胡运发;;基于性质语意的协同方法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
3 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
4 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
5 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
6 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 王厚峰;;机器翻译中汉语词节点的识别[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 侯敏;陈琼璜;初田天;李湛;王瑜;叶立;;汉语自动分词中的上下文相关歧义字段(CSAS)研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 孙承杰;黄昌宁;关毅;;基于标注语料库的组合歧义检测与消解[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
2 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
3 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
4 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
5 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
6 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
7 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
8 张雪英;基于粗糙集理论的文本自动分类研究[D];南京理工大学;2005年
9 赵章界;短语结构制导的范畴表达式演算[D];中国科学院研究生院(计算技术研究所);2006年
10 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 程冲;信息检索用汉语分词与未登录词识别技术研究[D];南京农业大学;2007年
2 温滔;自适应歧义切分的汉语分词系统的设计与实现[D];苏州大学;2005年
3 武玉洲;汉语文本人名识别改进方法研究[D];北京语言大学;2007年
4 曹晶;同义词挖掘及其在概念信息检索系统中的应用研究[D];东北师范大学;2006年
5 魏磊;CBT开发平台中的知识抽取技术研究[D];南京航空航天大学;2006年
6 曹帷;教学系统中的语音技术[D];天津师范大学;2006年
7 贺胜;面向现代汉语文本处理的全文检索、自动分词通用系统[D];南京师范大学;2006年
8 苏芳仲;中文Web文本挖掘的若干关键技术研究及其实现[D];福州大学;2006年
9 张六四;基于远程教育的智能答疑系统的研究与实现[D];西安电子科技大学;2006年
10 何银俊;基于RDF的语义检索技术研究[D];河海大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 王新潮;关于日本人的姓名[J];解放军外国语学院学报;1980年02期
2 张治强;外国人的姓名——(八)东非人的姓名[J];世界历史;1980年02期
3 楚庄;姓名字号[J];天津师范大学学报(社会科学版);1980年06期
4 英;《日本姓名词典》出版[J];辞书研究;1980年02期
5 蔡风;;你知道吗[J];中国民族;1980年02期
6 钱文辉;《核舟记》中的“船背”与“初平山人”[J];南京师大学报(社会科学版);1981年01期
7 马蹄疾;文尹是瞿秋白还是杨之华[J];社会科学辑刊;1981年01期
8 苏德昌;;日中称呼比较[J];日语学习与研究;1981年04期
9 孟宪满;;不留姓名的汇款单[J];中国农垦;1981年06期
10 孙法理;英美姓名杂談[J];四川外语学院学报;1982年01期
中国重要会议论文全文数据库 前10条
1 范海虹;;俄汉姓名称呼对比[A];外语语言教学研究——黑龙江省外国语学会第十一次学术年会论文集[C];1997年
2 张锡禄;;白族姓名初探[A];民族学研究第五辑[C];1983年
3 ;代表、工作人员名单[A];2000年全国包装和食品机械及相关技术发展研讨会文集[C];1992年
4 张书岩;;单双名问题考察[A];语言文字应用研究论文集(Ⅰ)[C];1995年
5 ;出席研討會來賓、代表名錄[A];社会主义市场经济与商业道德的挑战——1996商业道德国际研讨会论文集[C];1996年
6 ;论文作者索引[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年
7 徐本立;;《李白为李渊五世孙考》补证[A];中国李白研究(一九九一年集)——中国首届李白研究国际学术讨论会论文集[C];1991年
8 刘文刚;;李白之父不名客辨[A];中国李白研究(1994年集)[C];1994年
9 郑方;胡起秀;邓翔;吴文虎;方棣棠;;介绍一种傻瓜式声控电话机[A];第四届全国人机语音通讯学术会议论文集[C];1996年
10 李正己;;蔬菜残留有机磷农药中毒1000余例抢救总结[A];中华医学会急诊医学学会第六次全国急诊医学学术会议论文汇编[C];1996年
中国重要报纸全文数据库 前10条
1 北京市科委保密委员会主办;软件陷门与口令漏洞[N];北京科技报;2000年
2 玉珍 彭雪芳 纳日碧力戈 (作者单位:中国社科院民研究;人名社会学:时下取名风尚三人谈[N];北京日报;2000年
3 ;人口普查流程[N];北京日报;2000年
4 实习生 校旭东 任晓莹;地名不能乱起了[N];兵团日报(汉);2000年
5 楼兴望;寿险投保单中受益中受益人的填写[N];中国保险报;2000年
6 本报记者 张喜翔;“爱心献血”引发纷争[N];中国妇女报;2000年
7 杨海;药品广告用病例,违法![N];中国工商报;2000年
8 ;高等学校学生资助政策问答 (续)[N];中国教育报;2000年
9 深圳记者站 田雪芹;深圳行动雷厉风行[N];中国旅游报;2000年
10 陈毛弟 潘清;《霓虹灯下的哨兵》著作权侵权案有结果[N];中国贸易报;2000年
中国博士学位论文全文数据库 前10条
1 程合红;商事人格权论[D];中国政法大学;2001年
2 鲍永军;汪辉祖研究[D];浙江大学;2004年
3 黄翊;澳门语言状况与语言规则研究[D];北京语言大学;2005年
4 陈宗利;限定性关系结构的句法研究[D];广东外语外贸大学;2005年
5 Philip Allen McBrayer;[D];华中师范大学;2005年
6 露西娜;来自国际贸易的技术外溢[D];复旦大学;2005年
7 任斌;[D];华东师范大学;2005年
8 毛晓阳;清代江西进士丛考[D];浙江大学;2006年
9 Imran Haider Shamsi;大豆镉毒害耐性的基因型差异和镉与铝、钠和钾的互作效应[D];浙江大学;2006年
10 曹精华;[D];北京外国语大学;1992年
中国硕士学位论文全文数据库 前10条
1 吴芳;姓名的跨文化研究[D];广西大学;2002年
2 邓卫峰;姓名,透视文化的窗口[D];河北师范大学;2002年
3 周颖;论中英人名翻译[D];四川大学;2003年
4 庞秀慧;颠覆的游戏——论余华小说的叙事艺术[D];吉林大学;2004年
5 白锐;惟有东坡居士好,姓名高挂在黄州——苏轼谪居黄州时期的生存样态及其文学、书法创作[D];陕西师范大学;2004年
6 任瑞;跨文化交际下的中英姓氏比较研究[D];苏州大学;2004年
7 罗雁;[D];云南师范大学;2005年
8 缪艳玲;[D];云南师范大学;2005年
9 周玲丽;社会文化框架下的名字和命名的研究[D];重庆师范大学;2005年
10 Muhanad Smiri;Pendulum矫治器对于支抗牙及远中移动牙效果的研究[D];武汉大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026