收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于改进ELMO模型的组织机构名识别方法

胡万亭  郭建英  张继永  
【摘要】:组织机构名识别是命名实体识别的核心任务之一,也是最困难的任务。近年来,预训练模型在中文自然语言处理领域得到广泛应用,预训练的词嵌入模型在中文命名实体识别上取得了非常好的效果,但是在组织机构名识别上还有很大的提升空间。针对这一问题,改进ELMO(embedding from language models)预训练模型,结合双向LSTM神经网络模型和条件随机场模型,去识别组织机构名。对于ELMO的改进,主要通过筛选高频机构词,然后将高频机构词加入中文字典,通过ELMO模型训练生成机构词向量和普通字向量。字向量不用考虑未登录词的问题,机构词向量引入了先验知识,结合起来可以使得生成的字词向量能够更好地表征组织机构名。实验结果表明,预训练模型的数据集相对较小时,该方法比字向量嵌入的方法有更好的效果,F1值提高了1.3%。

知网文化
【相似文献】
中国期刊全文数据库 前17条
1 朱丹浩;杨蕾;王东波;;基于深度学习的中文机构名识别研究——一种汉字级别的循环神经网络方法[J];现代图书情报技术;2016年12期
2 夏赟;李志蜀;;基于统计的中文机构名自动识别[J];四川大学学报(自然科学版);2009年03期
3 刘杰;;基于统计的中文机构名实体识别的研究[J];佳木斯大学学报(自然科学版);2010年03期
4 陈霄;刘慧;陈玉泉;;基于支持向量机方法的中文组织机构名的识别[J];计算机应用研究;2008年02期
5 冯丽萍;;基于统计的中文组织机构名识别[J];福建电脑;2006年01期
6 周波;蔡东风;;基于条件随机场的中文组织机构名识别研究[J];沈阳航空工业学院学报;2009年01期
7 郝娟;杨静;;采用上下文特征匹配的中文机构名简称识别[J];小型微型计算机系统;2015年07期
8 李军;王丁;王鑫;;基于模板匹配的中文机构名识别[J];信息技术;2008年06期
9 麦合甫热提;米日姑·肉孜;麦热哈巴·艾力;吐尔根·依布拉音;;基于语法语义知识的维吾尔文机构名识别[J];计算机工程与设计;2014年08期
10 赵亚慧;;基于编辑距离的中文机构名简称检索方法研究[J];内蒙古科技与经济;2010年07期
11 冯丽萍;焦莉娟;;结合多特征的支持向量机中文组织机构名识别模型[J];现代计算机(专业版);2010年07期
12 钟良伍;郑方;;基于中文机构名简称的检索方法研究[J];中文信息学报;2007年01期
13 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
14 陈慧;;中文组织机构名命名规范化问题刍议[J];人文丛刊;2011年00期
15 冯冲;陈肇雄;黄河燕;;采用主动学习策略的组织机构名识别[J];小型微型计算机系统;2006年04期
16 冯丽萍;焦莉娟;;基于最大熵的中文组织机构名识别模型[J];计算机与数字工程;2010年12期
17 买合木提·买买提;王路路;吐尔根·依布拉音;艾山·吾买尔;卡哈尔江·阿比的热西提;;基于条件随机场的维吾尔文机构名识别[J];计算机工程与设计;2019年01期
中国重要会议论文全文数据库 前3条
1 雷静;;汉语机构名的构成模式[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 计峰;高沫;邱锡鹏;黄萱菁;;中文机构名简称的自动生成研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 潘华山;严馨;余正涛;郭剑毅;;融合实体特性的柬埔寨语命名实体识别方法[A];第26届中国控制与决策会议论文集[C];2014年
中国硕士学位论文全文数据库 前19条
1 万如;中文机构名识别的研究[D];大连理工大学;2008年
2 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
3 乌兰敖日格乐;中文军事组织机构名的识别[D];大连理工大学;2010年
4 米日姑·肉孜;维吾尔文机构名识别研究[D];新疆大学;2013年
5 陈霄;基于支持向量机的中文组织机构名识别[D];上海交通大学;2007年
6 凌雅娟;新闻文本中的中文机构名识别和机构关系抽取研究[D];华东师范大学;2013年
7 连誉舜;中文组织机构名检索系统的设计与实现[D];上海交通大学;2013年
8 刘璐;基于潜在语义分析与多特征融合的中文机构名识别[D];西北大学;2016年
9 杨德来;SVM和最大熵相结合的中文机构名自动识别[D];大连理工大学;2006年
10 刘彦宏;基于Internet的商业信息抽取[D];中国科学技术大学;2010年
11 藏丹;基于语块的汉蒙机构名自动翻译研究[D];内蒙古师范大学;2017年
12 戴思明;互联网文本热点信息实体识别研究及应用[D];华南理工大学;2012年
13 相晓敏;中文组织机构名识别和消歧技术研究与应用[D];华东师范大学;2016年
14 刘海鹏;面向手机短信的命名实体识别研究[D];北京邮电大学;2009年
15 杨晓东;中文命名实体识别及若干相关问题的研究[D];江苏大学;2010年
16 陈丹双;POI(Point of Interest)名称识别及其在对话导航系统中的应用[D];复旦大学;2013年
17 王树伟;面向金融文本的实体识别与关系抽取研究[D];哈尔滨工业大学;2014年
18 张祝玉;基于条件随机场的中文命名实体识别[D];东北大学;2009年
19 周波;面向问答系统的实体识别与分类研究[D];沈阳航空工业学院;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978