收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于条件随机场方法的开放领域新词发现

陈飞  刘奕群  魏超  张云亮  张敏  马少平  
【摘要】:开放领域新词发现研究对于中文自然语言处理的性能提升有着重要的意义.利用条件随机场(condition random field,简称CRF)可对序列输入标注的特点,将新词发现问题转化为预测已分词词语边界是否为新词边界的问题.在对海量规模中文互联网语料进行分析挖掘的基础上,提出了一系列区分新词边界的统计特征,并采用CRF方法综合这些特征实现了开放领域新词发现的算法,同时比较了K-Means聚类、等频率、基于信息增益这3种离散化方法对新词发现结果的影响.通过在SogouT大规模中文语料库上的新词发现实验,验证了所提出的方法有较好的效果.

知网文化
【相似文献】
中国期刊全文数据库 前14条
1 周寅;;基于字向量的条件随机场的中文分词方法[J];武汉船舶职业技术学院学报;2019年04期
2 张开旭;夏云庆;宇航;;基于条件随机场的古文自动断句与标点方法[J];清华大学学报(自然科学版)网络.预览;2009年10期
3 李玲玲;金泰松;李翠华;;基于局部特征和隐条件随机场的场景分类方法[J];北京理工大学学报;2012年07期
4 燕杨;尤紫如;;基于平稳小波与条件随机场的视网膜血管分割[J];长春师范大学学报;2021年04期
5 宋青松;张超;陈禹;王兴莉;杨小军;;组合全卷积神经网络和条件随机场的道路分割[J];清华大学学报(自然科学版);2018年08期
6 蔡鑫奇;王瑞;石亮;牟迪;马春宇;;基于条件随机场的软件变更影响分析方法[J];航天控制;2019年01期
7 戴丹;胡杨;刘骊;冯旭鹏;刘利军;黄青松;;基于层叠条件随机场的微博热点话题跟踪[J];计算机应用与软件;2016年04期
8 潘华山;严馨;周枫;余正涛;郭剑毅;;基于层叠条件随机场的高棉语分词及词性标注方法[J];中文信息学报;2016年04期
9 鹿凯宁;孙琪;刘安安;杨兆选;;基于隐条件随机场的人体行为识别方法[J];天津大学学报(自然科学与工程技术版);2013年10期
10 何彬;关毅;;基于字级别条件随机场的医学实体识别[J];智能计算机与应用;2019年02期
11 夏圆;张征;;基于条件随机场的评价对象抽取[J];计算机系统应用;2017年11期
12 褚一平;张引;叶修梓;张三元;;基于隐条件随机场的自适应视频分割算法[J];自动化学报;2007年12期
13 张开旭;夏云庆;宇航;;基于条件随机场的古汉语自动断句与标点方法[J];清华大学学报(自然科学版);2009年10期
14 杨晓燕;徐戈;谢安;庄泽彬;;基于词典与条件随机场的中文菜名识别研究[J];信息与电脑(理论版);2018年17期
中国重要会议论文全文数据库 前9条
1 辛永;;基于条件随机场的设备主体名称识别[A];第二届智能电网会议论文集[C];2018年
2 彭洪保;李茹;段建勇;;基于汉语框架网的问句语义角色自动标注研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 潘华山;严馨;余正涛;郭剑毅;;融合实体特性的柬埔寨语命名实体识别方法[A];第26届中国控制与决策会议论文集[C];2014年
4 尉舒舒;;基于微博对话链的命名实体识别[A];第十一届中国通信学会学术年会论文集[C];2015年
5 张奇;翁富良;黄萱菁;吴立德;;英文口语中非流利区域的检测[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 王根;赵军;;基于多重冗余标记CRF的句子情感分析研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 康旭珍;李双红;李茹;;框架元素语义核心词自动识别研究[A];第六届全国信息检索学术会议论文集[C];2010年
8 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前13条
1 仇文亮;基于条件随机场的视觉显著性目标检测[D];西安电子科技大学;2018年
2 穆一夫;基于认知的非结构化信息抽取关键技术与算法研究[D];中国矿业大学(北京);2013年
3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
4 张晓峰;基于条件随机场的目标提取[D];华东师范大学;2012年
5 林颖;基于水平集方法的图像分割关键技术研究[D];哈尔滨工程大学;2010年
6 万怀宇;社会网络中基于链接的分类问题研究[D];北京交通大学;2012年
7 马技;基于显著性与部位建模的模型推荐行人检测算法研究[D];东北大学;2018年
8 蒋林峰;基于条件随机场模型的目标检测方法研究[D];上海交通大学;2019年
9 梁晔;基于视觉显著性的显著区域提取方法及其应用研究[D];北京交通大学;2018年
10 刘涛;基于有监督分层狄里克雷过程的对象分割模型[D];北京邮电大学;2016年
11 王晓燕;自由立体显示的串扰研究及单幅图像的深度重构[D];天津大学;2014年
12 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
13 田虎;单目图像的深度估计[D];北京邮电大学;2015年
中国硕士学位论文全文数据库 前20条
1 李佳歆;基于序列模型的文本语义匹配方法研究[D];重庆邮电大学;2018年
2 李经纬;基于条件随机场的图像语义分割研究[D];上海交通大学;2018年
3 甘清海;基于多级联卷积神经网络和条件随机场的脑肿瘤分割研究[D];湘潭大学;2019年
4 邵轶男;基于图模型的序列标注技术研究[D];哈尔滨工业大学;2019年
5 戴伟达;基于全卷积神经网络的语义分割算法研究[D];南京邮电大学;2019年
6 甘亦炘;基于条件随机场的端对端图像语义分割算法研究[D];西安电子科技大学;2019年
7 雪洋;英文实体识别任务的研究[D];上海交通大学;2016年
8 林文奇;基于拟合的图像显著性检测优化算法研究[D];福州大学;2018年
9 姚澜;基于改进自注意力的机器阅读理解系统设计与实现[D];华中科技大学;2019年
10 沈豪;互联网评论文本观点挖掘策略研究[D];南京大学;2019年
11 谷兴龙;基于条件随机场与改进LSTM的短文本挖掘研究[D];太原理工大学;2019年
12 刘一鸣;基于深度学习与条件随机场的宫颈癌细胞学图像的细胞核分割[D];中北大学;2019年
13 张瑜;基于条件随机场的鲁棒性深度相关滤波目标跟踪研究[D];江苏科技大学;2018年
14 金雪梅;基于条件随机场的交通场景理解算法研究[D];东北大学;2015年
15 韦杨柳;基于条件随机场的植物细胞追踪算法研究[D];湖南大学;2018年
16 李楠;基于多视觉目标融合的图像情感分类方法研究[D];北京交通大学;2018年
17 李金龙;结合多种特征和条件随机场的显著性区域分割[D];湖南师范大学;2018年
18 傅科达;面向新闻文本的情感原因抽取算法研究[D];哈尔滨工业大学;2018年
19 徐晓芳;基于条件随机场的中文分词技术的研究与实现[D];南京邮电大学;2018年
20 韩浩;结合FCN与条件随机场的道路场景分割模型的研究[D];武汉理工大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978