收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于条件随机域CRF模型的文本信息抽取

周晶  吴军华  陈佳  陈沈焰  
【摘要】:为了抽取文本中的信息,在分析对比了4种统计建模原型后,选用条件随机域CRF建立抽取模型,提出了一种文本信息抽取的方法。该方法对文本分析后加标注,确定文本特征集,采用有限内存拟牛顿迭代方法L-BFGS算法估计CRF模型参数,根据训练学习得出的模型,实现科研论文数据集头部文本信息的抽取。实验结果表明,使用CRF模型的抽取准确率达到90%以上,远远高于使用HMM模型的抽取准确率。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙广路;郎非;薛一波;;基于条件随机域和语义类的中文组块分析方法[J];哈尔滨工业大学学报;2011年07期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前4条
1 李彦鹏;杨志豪;林鸿飞;;基于条件随机域的生物医学命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王浩畅;赵铁军;刘延力;于浩;;生物医学文本中命名实体识别的智能化方法[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
3 王浩畅;赵铁军;李艳;;生物医学命名实体识别的特征选取与评价[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 史树敏;王志强;周浪;冯冲;黄河燕;;基于条件随机域的中文命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前2条
1 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
2 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 王敬普;基于包装器模型的文本信息抽取算法研究[D];湖南大学;2006年
2 于静;汉语句子的组块识别研究[D];大连理工大学;2008年
3 潘越群;时间表达式识别与归一化研究[D];哈尔滨工业大学;2008年
4 徐琳宏;基于语义资源的文本情感计算[D];大连理工大学;2007年
5 罗雪兵;汉语组块识别的研究[D];大连理工大学;2007年
6 马龙;基于条件随机域模型的中文地名识别的研究[D];大连理工大学;2009年
7 王琦;词典和机器学习相结合的生物命名实体识别[D];大连理工大学;2009年
8 肖清梅;汉语组块识别的研究与应用[D];大连理工大学;2009年
9 胡思磊;基于CRF模型的汉语介词短语识别[D];大连理工大学;2008年
10 廖先桃;中文命名实体识别方法研究[D];哈尔滨工业大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978