收藏本站
《成都信息工程学院学报》 2006年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

决策树在中文姓名信息提取中的应用研究

史永刚  左志宏  
【摘要】:提出并实现了一种中文姓名信息提取方法,该方法首先根据姓氏和名的用字概率信息,将姓氏作为抽取的触发条件,在文本中初步提取姓名。然后再充分利用中文姓名的上下文信息及姓名用字之间的关联程度的信息,选取特征作为决策树测试的属性列表,并将初步提取出来的姓名是否是真实姓名(bool型的值:yes或no)作为决策树要预测的目标属性,组建基于ID3算法的决策树进一步提取出正确的姓名,实验结果表明,该方法具有很好的召回率和准确率。
【作者单位】电子科技大学计算机学院 电子科技大学计算机学院
【分类号】:TP391.1

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 和雪娟;基于统计和规则混合策略的中国人名识别研究[D];云南师范大学;2007年
2 万光明;基于普适计算的会议论文评审系统研究[D];山东大学;2012年
【参考文献】
中国期刊全文数据库 前8条
1 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
2 马秀红,宋建社,董晟飞;数据挖掘中决策树的探讨[J];计算机工程与应用;2004年01期
3 韩慧,毛锋,王文渊;数据挖掘中决策树算法的最新进展[J];计算机应用研究;2004年12期
4 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
5 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
6 刘挺,王开铸;关于歧义字段切分的思考与实验[J];中文信息学报;1998年02期
7 王静红,王熙照,邵艳华,王伍伶;决策树算法的研究及优化[J];微机发展;2004年09期
8 张跃,姚天顺;基于结合性自动识别中文姓名[J];小型微型计算机系统;1997年10期
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 程节华;自动分词中的歧义字段分析及处理[J];安徽农业技术师范学院学报;2000年03期
3 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
4 彭莉芬;陈俊生;胡学钢;;基于粗糙集决策树算法的研究[J];安庆师范学院学报(自然科学版);2012年01期
5 姜红艳;;决策树ID3算法在学生成绩中的应用[J];鞍山师范学院学报;2008年04期
6 葛文英;吕靖;;基于条件随机场的中文人名识别[J];安阳师范学院学报;2010年05期
7 赵玉鹏;;论机器学习[J];安阳工学院学报;2011年04期
8 孙雪;李昆仑;胡夕坤;赵瑞;;基于半监督K-means的K值全局寻优算法[J];北京交通大学学报;2009年06期
9 赵勇;刘凯;;数字挖掘方法在遥感分类中的应用研究[J];北京测绘;2009年03期
10 沈奕,滑峰,刘椿年;基于GDT的对FOIL系统的改进[J];北京工业大学学报;2005年02期
中国重要会议论文全文数据库 前10条
1 李帅;黄玺瑛;董家瑞;;一种基于神经网络的特定文本信息提取方法[A];第十届中国科协年会论文集(一)[C];2008年
2 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
3 周蕾;李培峰;朱巧明;杨季文;;碎片分词与词结合提取的未登录词识别方法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
4 张敏;陆向艳;周敏;潘林琳;农冬冬;王彬彬;陈晓江;;数据挖掘在智能题库系统中的应用[A];广西计算机学会2004年学术年会论文集[C];2004年
5 侯敏;侯敞;;汉英机译系统译文质量的评测[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
6 ;Research on Data Mining Algorithms for Glutamic Acid Fermentation Process[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
7 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
8 马玉莲;王宇冬;王鑫;;基于解释的分类算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 杜琳;石慧;刘晓平;;一种基于Q学习的任务调度算法的改进研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
10 金双民;段海新;郑辉;;IRC僵尸网络控制端识别系统的设计与实现[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
中国博士学位论文全文数据库 前10条
1 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
2 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
3 曹葵康;支持向量机加速方法及应用研究[D];浙江大学;2010年
4 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
5 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
6 聂黎;基于基因表达式编程的车间动态调度方法研究[D];华中科技大学;2011年
7 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
8 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年
9 陈俊;笑脸表情分类识别的研究[D];华南理工大学;2011年
10 刘宏兵;多目标粒度支持向量机及其应用研究[D];武汉理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
3 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年
4 王利明;一种基于PMIPv6的智能辅助高效切换方案[D];郑州大学;2010年
5 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
6 周东海;基于记账凭证的高校教育成本数据挖掘研究[D];哈尔滨工程大学;2010年
7 吴迪;高校毕业生就业推荐系统的设计与开发[D];大连理工大学;2010年
8 安波;基于蛋白质关系网络的蛋白质络合物抽取研究[D];大连理工大学;2010年
9 蒋延生;基于图的适应性相似度估算的半监督学习[D];大连理工大学;2010年
10 周翔;决策支持技术在企业销售系统中的应用研究[D];中国海洋大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 解瑾;王学优;;中外教育技术学术期刊网络技术应用现状研究[J];电化教育研究;2006年06期
2 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
3 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
4 贾素来;;XML文档解析技术分析[J];电脑开发与应用;2007年02期
5 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
6 蔡勇智;;未登录词识别算法的改进[J];福建电脑;2006年03期
7 伞晓丽;;基于JDBC的SQL Server数据库访问技术[J];福建电脑;2006年05期
8 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
9 李华春;;采用智能客户端技术进行移动应用开发[J];华南金融电脑;2006年07期
10 吴芬芬;刘磊;;基于神经网络的中文姓名抽取技术[J];吉林大学学报(理学版);2006年03期
中国博士学位论文全文数据库 前1条
1 王海鹏;普适资源管理关键技术研究[D];西北工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 周静;精密播种机数字化设计系统中的实例检索算法的研究[D];沈阳理工大学;2011年
2 任敏;基于蓝牙技术的PC机与手机的数据通信[D];西南交通大学;2011年
3 朱敏;基于MapReduce的并行决策树分类算法研究与实现[D];江西师范大学;2011年
4 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
5 郭梅;基于MVC模式Web应用框架的研究与应用[D];河海大学;2004年
6 党辉;基于J2EE的企业销售系统的研究与开发[D];南京理工大学;2004年
7 白清源;基于J2EE和MVC模式的WEB应用研究[D];西南交通大学;2005年
8 邓虎成;基于J2EE的应用框架设计与研究[D];西南交通大学;2005年
9 考持坤;基于J2EE的Web数据库应用技术[D];南京理工大学;2004年
10 罗功宸;普适计算多相性及个人智能环境研究[D];浙江大学;2006年
【二级参考文献】
中国期刊全文数据库 前7条
1 郭景峰,米浦波,刘国华;决策树算法的并行性研究[J];计算机工程;2002年08期
2 张俊盛,陈舜德,郑萦,刘显仲,柯淑津;多语料库作法之中文姓名辨识[J];中文信息学报;1992年03期
3 孙茂松,黄昌宁,高海燕,方捷;中文姓名的自动辨识[J];中文信息学报;1995年02期
4 糜元根;数据挖掘方法的评述[J];南京化工大学学报(自然科学版);2001年05期
5 王挺,陈火旺,杨谊,史晓东;一种自适应词性标注方法[J];软件学报;1997年12期
6 杨明,张载鸿;决策树学习算法ID3的研究[J];微机发展;2002年05期
7 郑家恒,刘开瑛;汉语姓名自动辨识初探[J];语言文字应用;1994年02期
【相似文献】
中国期刊全文数据库 前10条
1 叶琳莉;黄日茂;;结合决策树方法的中文机构名称识别[J];福建电脑;2007年12期
2 王振华,孔祥龙,陆汝占,刘绍明;结合决策树方法的中文姓名识别[J];中文信息学报;2004年06期
3 肖海涛;许南山;;决策树在化工企业生产平稳度分析中的应用[J];计算机与现代化;2006年09期
4 华文立;胡学刚;;平衡决策树分类精度与规则简易性研究[J];安徽电子信息职业技术学院学报;2006年04期
5 汪云亮;吕久明;;基于决策树的雷达属性分类方法[J];电子信息对抗技术;2007年01期
6 郑春香;董甲东;;分类技术研究及在高校人才识别中的应用[J];安庆师范学院学报(自然科学版);2007年01期
7 续蕾;刘玉江;;基于经营决策为主题的数据挖掘的应用——决策树算法实例研究[J];电脑知识与技术(学术交流);2007年05期
8 姜楠;高巍;张丽秋;;基于Analysis Services的数据挖掘模型的研究与应用[J];机械设计与制造;2007年04期
9 迟庆云;;决策树技术在汽车销售中的应用[J];微计算机信息;2008年09期
10 张仁伟;王洪斌;;一种基于行为检测的垃圾邮件过滤技术[J];哈尔滨职业技术学院学报;2008年04期
中国重要会议论文全文数据库 前10条
1 支流;段慧明;朱学锋;俞士汶;;中文缩略语知识库建设[A];第三届学生计算语言学研讨会论文集[C];2006年
2 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
4 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年
8 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
10 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
中国重要报纸全文数据库 前10条
1 本报记者 姜靖;张全:给网络装上“电子眼”[N];科技日报;2009年
2 本报记者 祝蕾 见习记者 许凯;李晓戈:努力缩小国内外数字“鸿沟”[N];济南日报;2010年
3 金利;东北大学自然语言处理实验室形成特色[N];科技日报;2007年
4 小柯;张全:网络环境“清洁师”[N];广东科技报;2009年
5 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
6 沈建缘;洪小文:时尚科学家[N];经济观察报;2009年
7 记者 刘传书;微软在深圳设实验室[N];科技日报;2006年
8 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
9 ;开天辟地第一回[N];计算机世界;2002年
10 刘洁;SAS分析产品链增添“新成员”[N];科技日报;2008年
中国博士学位论文全文数据库 前10条
1 卢延鑫;基于自然语言处理技术的循证医学信息提取研究[D];复旦大学;2011年
2 计峰;自然语言处理中序列标注模型的研究[D];复旦大学;2012年
3 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
4 代印唐;基于语义网络的知识协作关键技术研究[D];复旦大学;2009年
5 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
6 王立欣;翻译标准自动量化方法研究[D];上海外国语大学;2007年
7 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
8 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
9 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
10 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 张锦明;中文语义倾向识别的关键算法研究[D];北京邮电大学;2008年
2 路慧萍;保持隐私的决策树构造过程的研究[D];同济大学;2006年
3 陆青;利用遗传算法演化决策树并构造信用评估系统对银行客户信用评估分析[D];上海交通大学;2008年
4 王颖;基于数据挖掘技术的银行客户关系管理[D];贵州大学;2006年
5 顾萃琛;基于业务数据分析的保险公司辅助决策支持系统[D];上海师范大学;2010年
6 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
7 毛志雄;基于DM技术的化工生产过程控制的优化研究[D];中南大学;2005年
8 王志浩;数据挖掘在招生信息处理系统中的应用研究[D];山东师范大学;2006年
9 张峰;基于自然语言处理的自动文摘系统[D];电子科技大学;2006年
10 凌昊;基于决策树分类算法的网络入侵检测系统的研究[D];湖南大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026