收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于词向量和条件随机场的中文命名实体分类

马孟铖  杨晴雯  艾斯卡尔·艾木都拉  吐尔地·托合提  
【摘要】:针对中文命名实体识别及分类问题,提出一种基于词向量聚类和条件随机场的方法。分析语料语言特点并选取统计特征,构建特征模板识别测试语料中的命名实体;利用词向量包含丰富语义信息这一特点,将训练集中的实体词向量聚类成一个个簇;通过比较每一个簇与已识别的测试集命名实体之间的相似度距离,实现中文命名实体的分类。实验结果表明,在该方法下所分8个类别中,命名实体分类的F1值最高达到93.04%,F1值的平均值达到了83.82%。

知网文化
【相似文献】
中国期刊全文数据库 前18条
1 王睿,张洁,张由仪,于禛,姚天昉;基于混合模型的中文命名实体抽取系统[J];清华大学学报(自然科学版);2005年S1期
2 王志娟;李福现;;跨语言命名实体翻译对抽取的研究综述[J];计算机科学;2017年S1期
3 袁慧;马建霞;;命名实体情报挖掘方法研究及其在图书馆中的发展[J];图书馆理论与实践;2017年10期
4 翟海军;郭勇;郭嘉丰;程学旗;;基于转移学习的命名实体挖掘技术[J];上海交通大学学报;2011年02期
5 赵君喆;何婷婷;李晶;;一种无指导命名实体关系抽取研究[J];咸宁学院学报;2009年06期
6 李治国;蔡东风;周俏丽;杨者青;;在篇章中利用互信息识别命名实体的研究[J];沈阳航空工业学院学报;2007年01期
7 高佳奕;刘震;杨涛;谢佳东;史话跃;董海艳;胡孔法;;基于条件随机场的中医临床医案症状命名实体抽取研究[J];世界科学技术-中医药现代化;2020年06期
8 单义栋;王衡军;王娜;;基于多标签的军事领域命名实体识别[J];计算机科学;2019年S2期
9 徐璐;严馨;夏青;周枫;莫源源;;基于特征相似度的可比语料挖掘汉柬命名实体等价对[J];计算机与数字工程;2017年05期
10 怀宝兴;宝腾飞;祝恒书;刘淇;;一种基于概率主题模型的命名实体链接方法[J];软件学报;2014年09期
11 余传明;黄建秋;郭飞;;从客户评论中识别命名实体——基于最大熵模型的实现[J];现代图书情报技术;2011年05期
12 王静雅;袁保社;;基于模板的汉维商品命名实体翻译研究[J];现代计算机(专业版);2015年08期
13 蒋龙;周明;简立峰;;利用音译和网络挖掘翻译命名实体[J];中文信息学报;2007年01期
14 乐小虬,杨崇俊,刘冬林;空间命名实体的识别[J];计算机工程;2005年20期
15 林泽斐;欧石燕;;多特征融合的中文命名实体链接方法研究[J];情报学报;2019年01期
16 马国来;尹长青;宋善威;;基于机器翻译语块的命名实体翻译方法研究[J];硅谷;2015年03期
17 姜文志;顾佼佼;胡文萱;王彦;;基于多模型结合的军事命名实体识别[J];兵工自动化;2011年10期
18 李妩可;郭赛球;尹艳;;命名实体关系抽取算法的改进[J];计算机工程;2010年24期
中国重要会议论文全文数据库 前10条
1 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 翟海军;郭勇;郭嘉丰;程学旗;;基于转移学习的命名实体挖掘技术[A];第五届全国信息检索学术会议论文集[C];2009年
3 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
4 张磊;王斌;靖红芳;吴丽辉;;中文网页搜索日志中的特殊命名实体挖掘[A];第五届全国信息检索学术会议论文集[C];2009年
5 尉舒舒;;基于微博对话链的命名实体识别[A];第十一届中国通信学会学术年会论文集[C];2015年
6 王浩畅;赵铁军;李艳;;生物医学命名实体识别的特征选取与评价[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 薛征;廖闻剑;;基于位置权重和实体识别的关键词提取[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
8 齐振宇;赵军;杨帆;;一种开放式中文命名实体识别的新方法[A];第五届全国信息检索学术会议论文集[C];2009年
9 姚天昉;;一种用于汉语信息抽取的词汇本体[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 王浩畅;赵铁军;于浩;;基于文本的生物信息获取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前7条
1 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
2 郑志诚;用户查询歧义性分析研究[D];清华大学;2013年
3 刘晓江;基于统计滚雪球模型的知识挖掘理论与方法[D];中国科学技术大学;2011年
4 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
5 孙叔琦;基于统计的词汇级语义相关计算研究[D];哈尔滨工业大学;2014年
6 翟海军;面向Web信息检索的知识挖掘[D];中国科学技术大学;2010年
7 孙海峰;复杂信息网络中的文本内容挖掘[D];北京邮电大学;2017年
中国硕士学位论文全文数据库 前10条
1 夏青;汉柬命名实体翻译等价对获取方法研究[D];昆明理工大学;2016年
2 李晶;基于网络抱团发现的命名实体关系抽取[D];华中师范大学;2006年
3 赖华梁;基于Web文本挖掘的命名实体关系抽取研究[D];华南农业大学;2017年
4 段优;护理领域命名实体抽取方案研究[D];合肥工业大学;2019年
5 张兴宇;基于知识图谱构建的微博话题推荐研究[D];安徽理工大学;2019年
6 周淑悦;网络媒体语料库系统设计与实现[D];华中师范大学;2019年
7 邓迪;基于自匹配注意力机制的命名实体关系识别模型[D];厦门大学;2018年
8 黄东川;基于Word2Vec的中文命名实体链接研究[D];国防科学技术大学;2016年
9 蔡德胜;基于实体属性和内容的同义实体识别研究[D];合肥工业大学;2018年
10 袁玉虎;面向症状表型的命名实体抽取方法研究[D];北京交通大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978