收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究

吴俊  程垚  郝瀚  艾力亚尔·艾则孜  刘菲雪  苏亦坡  
【摘要】:专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。

知网文化
【相似文献】
中国期刊全文数据库 前19条
1 王昊;王密平;苏新宁;;面向本体学习的中文专利术语抽取研究[J];情报学报;2016年06期
2 李丽双;党延忠;张婧;李丹;;基于条件随机场的汽车领域术语抽取[J];大连理工大学学报;2013年02期
3 古迎志;董诚;裴兵兵;杜永萍;;基于术语抽取与分级匹配的项目指南推荐方法[J];情报工程;2018年03期
4 董洋溢;李伟华;于会;;文本特征和复合统计量的领域术语抽取方法[J];西北工业大学学报;2017年04期
5 胡文敏;何婷婷;张勇;;基于卡方检验的汉语术语抽取[J];计算机应用;2007年12期
6 何琳;;基于多策略的领域本体术语抽取研究[J];中国索引;2013年01期
7 曾镇;吕学强;李卓;;一种面向专利摘要的领域术语抽取方法[J];计算机应用与软件;2016年03期
8 何远标;乐小虬;张帆;;学术论文大纲中关键术语抽取方法研究[J];现代图书情报技术;2014年03期
9 张苏;梁颖红;牛丽;;基于术语抽取技术的新闻新词发现方法研究[J];苏州市职业大学学报;2014年03期
10 俞琰;赵乃瑄;;基于通用词与术语部件的专利术语抽取[J];情报学报;2018年07期
11 蒋俊梅;;基于平行语料库的双语术语抽取系统研究[J];现代电子技术;2016年15期
12 刘辉;刘耀;;基于条件随机场的专利术语抽取[J];数字图书馆论坛;2014年12期
13 刘剑;唐慧丰;刘伍颖;;一种基于统计技术的中文术语抽取方法[J];中国科技术语;2014年05期
14 于清;常乐;徐健;刘天毅;LI Xiao-long;;基于汉维医疗平行语料的双语术语抽取研究[J];内蒙古大学学报(自然科学版);2018年05期
15 侯婷;吕学强;李卓;;专利术语抽取的层次过滤方法[J];现代图书情报技术;2015年01期
16 丁杰;吕学强;刘克会;;基于边界标记集的专利文献术语抽取方法[J];计算机工程与科学;2015年08期
17 康小丽;章成志;王惠临;;基于可比语料库的双语术语抽取研究述评[J];现代图书情报技术;2009年10期
18 岳一峰;黄蔚;任祥辉;;一种基于BERT的自动文本摘要模型构建方法[J];计算机与现代化;2020年01期
19 王子牛;姜猛;高建瓴;陈娅先;;基于BERT的中文命名实体识别方法[J];计算机科学;2019年S2期
中国重要会议论文全文数据库 前1条
1 宁海燕;刘秉权;张德园;刘远超;王晓龙;;基于统计的中文领域术语自动抽取方法的比较研究[A];第五届全国信息检索学术会议论文集[C];2009年
中国硕士学位论文全文数据库 前10条
1 柴瑜晗;基于语义图的中文领域概念及关系抽取方法研究与实现[D];河北科技大学;2019年
2 陈观喜;文档的术语表自动构建方法研究[D];东南大学;2018年
3 古迎志;基于术语抽取与匹配的推送技术及应用[D];北京工业大学;2018年
4 赵东玥;面向科技文献的双语术语抽取技术研究及应用[D];北京工业大学;2018年
5 钟军;维吾尔语领域术语抽取研究[D];新疆大学;2014年
6 何福江;基于平行语料库的双语术语抽取[D];北京理工大学;2015年
7 王楠禔;基于BERT改进的文本表示模型研究[D];西南大学;2019年
8 杨彬;基于BERT词向量和Attention-CNN的智能司法研究[D];大连理工大学;2019年
9 元成;基于BERT的保险领域问答系统的研究与实现[D];北方民族大学;2020年
10 谭龙;领域文本术语抽取与语义概念图构建模型研究[D];华东交通大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978