收藏本站
《计算机工程与应用》 2003年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

信息抽取研究综述

李保利  陈玉忠  俞士汶  
【摘要】:信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。与信息检索不同,信息抽取直接从自然语言文本中抽取事实信息。过去十多年来,信息抽取逐步发展成为自然语言处理领域的一个重要分支,其独特的发展轨迹———通过系统化、大规模的定量评测推动研究向前发展,以及某些成功启示,如部分分析技术的有效性、快速NLP系统开发的必要性,都极大地推动了自然语言处理研究的发展,促进了NLP研究与应用的紧密结合。回顾信息抽取研究的历史,总结信息抽取研究的现状,将有助于这方面研究工作向前发展。

手机知网App
【引证文献】
中国期刊全文数据库 前10条
1 李彦刚;魏海平;侯兴华;;基于HTMLParser的Web信息抽取系统的设计与实现[J];辽宁石油化工大学学报;2006年02期
2 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
3 李跃进;赵晶;林鸿飞;;基于Internet的军事演习信息抽取系统[J];计算机工程与应用;2006年14期
4 屠文珂,阎保定,杨海涛;基于影射·特征·知识的辨识复杂彩色目标的方法[J];计算机工程与应用;2005年25期
5 梁晗;陈群秀;吴平博;;基于事件框架的信息抽取系统[J];中文信息学报;2006年02期
6 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[J];中文信息学报;2006年01期
7 张清军,朱才连,侯林山;信息抽取技术在LBS中的应用[J];四川大学学报(工程科学版);2005年01期
8 王睿,张洁,张由仪,于禛,姚天昉;基于混合模型的中文命名实体抽取系统[J];清华大学学报(自然科学版);2005年S1期
9 刘鲁红,刘力强,胡亚军;信息抽取技术在数字图书馆中的应用研究[J];情报理论与实践;2005年03期
10 余丰;朱东华;;信息抽取技术在竞争情报研究中的应用[J];情报杂志;2006年03期
中国重要会议论文全文数据库 前6条
1 张桂平;蔡东风;徐立军;尹宝生;陈建军;;以互联网为知识源的基于语段分析的交互式机器翻译技术的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
5 钟涛;陈群秀;;基于Web主题性信息检索的灾难性事件信息抽取系统[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
6 韩冰;林鸿飞;;基于支撑向量机的人物关系抽取[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 许建潮;Web挖掘中若干问题的研究[D];吉林大学;2005年
2 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
3 王立荣;信号通路相关文献挖掘与分析方法研究[D];中国科学技术大学;2007年
4 秦忠宝;基于混合知识表示的设计创新及知识获取研究[D];西北工业大学;2006年
5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
6 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年
7 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
8 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
9 乐小虬;非结构化网络空间信息智能搜索与服务研究[D];中国科学院研究生院(遥感应用研究所);2006年
10 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 李智;基于树结构的网页数据自动抽取方法的研究与实现[D];吉林大学;2005年
2 张玉良;一种基于后缀树的包装器自动生成方法的研究[D];吉林大学;2005年
3 汤赛丽;常识知识问答系统中知识库构建的研究与设计[D];河南大学;2005年
4 李跃进;基于Internet的信息抽取技术研究[D];大连理工大学;2005年
5 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
6 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
7 董树明;半结构化Web信息抽取技术及其应用研究[D];东南大学;2004年
8 庄明;装备发展战略研究信息化平台中汉语文本信息提取技术的研究[D];国防科学技术大学;2003年
9 李毅;半结构化文档中语义信息抽取方法的研究[D];清华大学;2004年
10 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 张茂元;邹春燕;卢正鼎;;一种基于语义匹配的Web信息提取方法研究[J];计算机工程与应用;2006年23期
2 李长玲;化柏林;;我国网络计量学研究的文献计量分析[J];图书情报工作;2006年09期
3 文庭孝;汉语自动分词研究进展[J];图书与情报;2005年05期
4 蒋望东;黄发良;;基于WEB的数据挖掘研究综述[J];湖南工程学院学报(自然科学版);2007年01期
5 唐懿芳 ,牛力 ,傅赛香 ,严小卫;文本的自动分类[J];广西师范大学学报(自然科学版);2001年04期
6 李亚飞,刘业政;Web挖掘的体系研究[J];合肥工业大学学报(自然科学版);2004年03期
7 钱宇华;梁吉业;王江;;动态粒度下的粗糙集近似[J];计算机科学;2005年03期
8 刘晓鹏,邢长征;基于WEB文本数据挖掘的研究[J];计算机与数字工程;2005年09期
9 卜东波,白硕,李国杰;文本聚类中权重计算的对偶性策略[J];软件学报;2002年11期
10 周文帅;冯速;;汉语分词技术研究现状与应用展望[J];山西师范大学学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前4条
1 王大禹;姚天顺;;使用一种半指导的学习机制识别中文未分词文本中的姓名(英文)[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
2 陈群秀;;信息处理用现代汉语句型系统的初步研究[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
3 周剑辉;苑春法;黄锦辉;李文捷;;金融领域内信息抽取规则的自动获取[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
4 王树西;刘群;白硕;;问答系统研究综述[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国博士学位论文全文数据库 前10条
1 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
2 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
3 任佳;分类关联规则挖掘及其在复杂工业过程中的应用研究[D];浙江大学;2006年
4 李刚;知识发现的图模型方法[D];中国科学院软件研究所;2001年
5 姚绍文;语义化Web的关键技术及其应用研究[D];电子科技大学;2002年
6 聂培尧;基于XML的半结构数据管理及数据集成问题研究[D];西北工业大学;2002年
7 李芸;信息科学和信息技术术语概念体系研究[D];北京语言文化大学;2003年
8 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
9 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
10 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 邓丹;汉英词语对齐技术研究[D];中国科学院研究生院(计算技术研究所);2004年
2 甘丹;语义Web中本体映射的研究[D];广西师范大学;2008年
3 周莉;基于特征优化选取和神经网络分类的在线手写签名验证术[D];武汉理工大学;2005年
4 宋丹;基于语义和链接的话题跟踪方法[D];大连理工大学;2007年
5 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
6 来德强;“哪儿”的非疑问用法[D];河南大学;2001年
7 吕晓辉;Web信息提取技术研究[D];西北工业大学;2001年
8 翟蕾;Web文档分类及信息抽取的研究与开发[D];西北工业大学;2001年
9 李岳梅;基于广义特征的产品创新设计方法与技术[D];浙江大学;2002年
10 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
【二级引证文献】
中国期刊全文数据库 前4条
1 刘华;;一种快速获取领域新词语的新方法[J];中文信息学报;2006年05期
2 董静;孙乐;冯元勇;黄瑞红;;中文实体关系抽取中的特征选择研究[J];中文信息学报;2007年04期
3 吴颖红;;数字图书馆应用技术的现状及发展分析[J];情报科学;2006年09期
4 王昊;;基于层次模式匹配的命名实体识别模型[J];现代图书情报技术;2007年05期
中国重要会议论文全文数据库 前4条
1 陈慧;董守志;张普;;基于动态流通语料库(DCC)的中文组织名简称考察与研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
2 钟涛;陈群秀;;基于Web主题性信息检索的灾难性事件信息抽取系统[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
3 韩冰;林鸿飞;;基于支撑向量机的人物关系抽取[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
4 邹红建;杨尔弘;;语篇标注中的事件标注研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 乐小虬;非结构化网络空间信息智能搜索与服务研究[D];中国科学院研究生院(遥感应用研究所);2006年
2 易明;基于Web挖掘的电子商务个性化推荐机理与方法研究[D];华中科技大学;2006年
3 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
4 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
5 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
6 李婧;小鼠bHLH转录因子家族预测及其大脑调控网络的构建[D];上海交通大学;2007年
7 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
8 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
9 秦忠宝;基于混合知识表示的设计创新及知识获取研究[D];西北工业大学;2006年
10 周文;基于概念的若干知识表示模型及相关方法研究[D];上海大学;2007年
中国硕士学位论文全文数据库 前10条
1 茅剑;中文Web文本聚类研究[D];厦门大学;2007年
2 郑智高;非处方药智能咨询系统的研究与开发[D];武汉理工大学;2006年
3 毋琳;特定领域问答系统中通用语义理解框架的设计与实现[D];河南大学;2007年
4 石宇;基于XML的Web信息抽取与集成技术的研究[D];大连海事大学;2006年
5 郭峰;面向行业搜索引擎的WEB文本挖掘技术研究[D];兰州大学;2006年
6 何莉;基于Web信息抽取的个性化信息服务研究与实现[D];华东师范大学;2007年
7 程书红;基于XML的Web信息抽取设计与实现[D];重庆大学;2007年
8 那宝贵;面向合作伙伴选择的中文WEB信息获取系统研究[D];辽宁工程技术大学;2007年
9 杨明莉;基于语义网的智能搜索模型的研究[D];东北师范大学;2007年
10 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 孙中友;李培峰;朱巧明;;事件信息抽取中的数据预处理方法研究[J];计算机应用与软件;2011年08期
2 于成龙;;中文网页信息抽取技术及分类算法研究[J];山东理工大学学报(自然科学版);2011年03期
3 魏晶晶;于然;廖祥文;;基于分隔符的中文论坛信息抽取[J];福建电脑;2011年06期
4 余传明;黄建秋;郭飞;;从客户评论中识别命名实体——基于最大熵模型的实现[J];现代图书情报技术;2011年05期
5 孙全红;张贞贞;;基于树结构的Web表格信息抽取方法[J];华北水利水电学院学报;2011年03期
6 钱程;阳小兰;;HTML到XML转换研究[J];计算机与现代化;2011年08期
7 姜文志;顾佼佼;丛林虎;;CRF与规则相结合的军事命名实体识别研究[J];指挥控制与仿真;2011年04期
8 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
9 梁吉光;田俊华;熊玲;;基于二阶HMM的信息抽取研究[J];情报杂志;2011年07期
10 方莹;;C-CRF模型在农作物名识别中的应用[J];广东农业科学;2011年06期
中国重要会议论文全文数据库 前10条
1 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
2 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
3 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 姜吉发;王树西;;一种自举的二元关系获取方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
5 李渝勤;孙丽华;;面向互联网舆情的热词分析技术[A];第六届全国信息检索学术会议论文集[C];2010年
6 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 齐振宇;赵军;杨帆;;一种开放式中文命名实体识别的新方法[A];第五届全国信息检索学术会议论文集[C];2009年
8 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 付瑞吉;秦兵;刘挺;;面向音乐领域的文本检索与挖掘系统[A];第五届全国青年计算语言学研讨会论文集[C];2010年
10 翟海军;郭嘉丰;王小磊;许洪波;;基于用户查询日志的命名实体挖掘[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国重要报纸全文数据库 前2条
1 上海交通大学APEX数据和知识管理实验室 王昊奋俞勇;语义Web推动下一代搜索[N];计算机世界;2007年
2 希安;微软试水信息检索[N];经济日报;2004年
中国博士学位论文全文数据库 前10条
1 江会星;汉语命名实体识别研究[D];北京邮电大学;2012年
2 钱伟中;基于判别式模型的蛋白质互作用文本挖掘技术研究[D];电子科技大学;2011年
3 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
4 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
5 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
6 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
7 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
8 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
9 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
10 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 王静;基于GHMM的Web文本信息抽取技术研究与系统设计[D];西安电子科技大学;2008年
2 杨永贵;中文信息抽取关键技术研究与实现[D];北京邮电大学;2008年
3 周昆;基于规则的命名实体识别研究[D];合肥工业大学;2010年
4 任惠;基于Stacking框架的命名实体识别[D];大连理工大学;2008年
5 牟力科;Web中文信息抽取技术与命名实体识别方法的研究[D];西北大学;2008年
6 刘杰;Web中文信息抽取中命名实体识别的研究及应用[D];西北大学;2009年
7 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
8 徐东兴;基于Gate框架的信息抽取系统的研究与实现[D];华东师范大学;2007年
9 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
10 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026