收藏本站
《大连理工大学学报》 2012年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

CRF与规则相结合的中文地名识别

李丽双  党延忠  廖文平  黄德根  张颖  
【摘要】:采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统.实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%.

【参考文献】
中国期刊全文数据库 前3条
1 黄德根,岳广玲,杨元生;基于统计的中文地名识别[J];中文信息学报;2003年02期
2 李丽双;黄德根;陈春荣;杨元生;;SVM与规则相结合的中文地名自动识别[J];中文信息学报;2006年05期
3 冯元勇;孙乐;李文波;张大鲲;;基于单字提示特征的中文命名实体识别快速算法[J];中文信息学报;2008年01期
【共引文献】
中国期刊全文数据库 前10条
1 李艳;吴建国;谢立勇;周巧富;;典型农林害虫分布与气候要素的关系[J];环境科学研究;2012年05期
2 於建峰;吴正升;;文本地名自动识别的空间信息检索研究[J];测绘科学技术学报;2011年03期
3 刘杰;;基于统计的中文机构名实体识别的研究[J];佳木斯大学学报(自然科学版);2010年03期
4 胡文博;都云程;吕学强;施水才;;基于多层条件随机场的中文命名实体识别[J];计算机工程与应用;2009年01期
5 李诺;张全;;利用地名用字分析的中文地名识别处理[J];计算机工程与应用;2009年28期
6 蒋文明;张雪英;李伯秋;;基于条件随机场的中文地址要素识别方法[J];计算机工程与应用;2010年13期
7 冯鲸华;古丽拉·阿东别克;玛依来·哈帕尔;;基于N-gram语言模型的哈萨克文机构名识别[J];计算机工程与应用;2010年31期
8 黄德根;孙迎红;;中文地名的自动识别[J];计算机工程;2006年03期
9 杨晓东;晏立;尤慧丽;;CCRF与规则相结合的中文机构名识别[J];计算机工程;2011年08期
10 王蕾;李培峰;朱巧明;杨季文;;一种基于框架结构的专有名词自动识别方法[J];计算机工程与科学;2007年07期
中国重要会议论文全文数据库 前7条
1 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
2 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
4 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 钱小飞;侯敏;;中文基本地名识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 李诺;张全;;基于概念属性特征的中文地名识别处理[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 张云涛;龚玲;王永成;;识别中文文本中的未登录专有名词的类别[A];2007年中国智能自动化会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
2 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
3 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
4 杨自忠;云南蜘蛛区系及其演化研究[D];河北大学;2006年
5 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
6 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
7 车海燕;面向中文自然语言Web文档的自动知识抽取和知识融合[D];吉林大学;2008年
8 张保石;河南省蜘蛛区系分类研究[D];河北大学;2007年
9 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
10 张博;多视点商品本体学习研究[D];武汉理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
2 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
3 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
4 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
5 杨晓东;中文命名实体识别及若干相关问题的研究[D];江苏大学;2010年
6 李英伟;基于增量改进贝叶斯领域问句分类研究[D];昆明理工大学;2009年
7 常卫丽;领域本体在中文命名实体识别中的应用研究[D];武汉理工大学;2011年
8 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
9 吴广财;HMM增量学习算法在中文命名实体识别中的应用研究[D];华南理工大学;2011年
10 朱世猛;中文分词算法的研究与实现[D];电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
2 谭红叶,郑家恒,刘开瑛;中国地名自动识别系统的设计与实现[J];计算机工程;2002年08期
3 姜维;王晓龙;关毅;赵健;;基于多知识源的中文词法分析系统[J];计算机学报;2007年01期
4 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
5 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
6 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
7 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
8 黄德根,岳广玲,杨元生;基于统计的中文地名识别[J];中文信息学报;2003年02期
9 王振华,孔祥龙,陆汝占,刘绍明;结合决策树方法的中文姓名识别[J];中文信息学报;2004年06期
10 刘非凡;赵军;吕碧波;徐波;于浩;夏迎炬;;面向商务信息抽取的产品命名实体识别研究[J];中文信息学报;2006年01期
【相似文献】
中国期刊全文数据库 前10条
1 李丽双;黄德根;陈春荣;杨元生;;SVM与规则相结合的中文地名自动识别[J];中文信息学报;2006年05期
2 陈明远,管汀鹭;打字能比说话更快——几种高速键盘的设计[J];自然杂志;1980年08期
3 唐亚伟;亚伟中文速录机的诞生与应用[J];中文信息;1994年05期
4 胡宜课;信息高速公路与中文信息处理技术[J];计算机工程;1996年S1期
5 张俊林;曲为民;杜林;孙玉芳;;跨语言信息检索研究进展[J];计算机科学;2004年07期
6 罗燕;中文信息检索系统中的自然语言理解技术研究[J];图书情报工作;2005年04期
7 谢谦;芮建武;吴健;;编码字符集标准及分类研究[J];中文信息学报;2006年05期
8 陈丹;李宁;李亮;;古文字的联机手写识别研究[J];北京机械工业学院学报;2008年04期
9 林浩;韩冰;杨乐华;;一种基于改进最大匹配快速中文分词算法[J];科技创新导报;2009年09期
10 吴新年;数字图书馆技术之进展[J];图书与情报;2000年02期
中国重要会议论文全文数据库 前10条
1 张云涛;龚玲;王永成;;识别中文文本中的未登录专有名词的类别[A];2007年中国智能自动化会议论文集[C];2007年
2 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
3 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
4 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
5 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
7 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
9 莫锦贤;马常楼;;文本文件转换成语音文件及其合成输出[A];第二届全国人机语音通讯学术会议论文集[C];1992年
10 乐明;冯志伟;;篇章修辞结构树库概述[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
2 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
3 倪光南;活力重现的中文信息处理[N];计算机世界;2001年
4 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年
5 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
6 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年
7 记者 韩晓玲通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
8 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年
9 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
10 本报记者 关逸民;中文速录成为自主核心技术产业[N];中国信息报;2006年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
3 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
4 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
5 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
6 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
7 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
8 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
9 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
10 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
中国硕士学位论文全文数据库 前10条
1 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年
2 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年
3 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
4 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
5 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
6 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年
7 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年
8 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年
9 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年
10 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026