收藏本站
《智能计算机与应用》 2012年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于BootStrapping的中文事件元素抽取系统设计与实现

赵江江  秦兵  
【摘要】:采用基于BootStrapping的方法实现中文事件元素抽取系统。其中,将事件元素抽取定义为一个模式匹配问题。针对这一问题,首先构建了初始种子集,然后创新性地引入了BootStrapping方法构建模板集,并使用模式匹配的方法进行事件元素抽取。在模板构造过程中,提出了基于BestMatch的模板泛化算法[1]。对任意两个事件实例模板[2]进行匹配,计算其匹配代价并泛化,提高了模板的覆盖能力。所实现的系统在ACE 2005语料测试中取得了不错结果。
【作者单位】哈尔滨工业大学计算机科学与技术学院;
【分类号】:TP391.1
【正文快照】:
0引言事件抽取任务随着互联网信息爆炸式的增长越来越凸显其重要性,而事件元素抽取又是事件抽取中至关重要的一个研究点。该研究旨在将无结构化文本中人们感兴趣的事件以结构化的形式存储下来,以供自动文摘、自动问答、话题检测[3]等自然语言处理上层技术的使用和用户方便的

【参考文献】
中国期刊全文数据库 前1条
1 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
中国博士学位论文全文数据库 前1条
1 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
2 霍娜;吕国英;;基于规则匹配的灾难性追踪事件信息抽取的研究[J];电脑开发与应用;2012年06期
3 方莹,葛寒松;基于聚类的分级信息抽取方法初探[J];电脑知识与技术;2005年30期
4 赵文;唐建雄;高庆锋;;基于统计的中文网页正文抽取的研究[J];电脑知识与技术;2008年01期
5 余承健;;基于表格语义的Web信息抽取方法的研究[J];电脑知识与技术;2008年12期
6 胡静芳;沈亚斌;;基于Web的新闻采集系统[J];电脑知识与技术;2009年19期
7 吴芳;郑君;刘金亮;宗克玄;;基于GATE框架的中文信息抽取技术的研究[J];电脑知识与技术;2009年24期
8 孙娜;;基于本体的文本分类研究综述[J];电脑知识与技术;2011年10期
9 齐嘉,傅骞;Web信息抽取技术在智能WAP网关中的应用[J];电信科学;2005年07期
10 杨珺;;基于在线翻译服务的集成应用框架[J];上海电力学院学报;2011年03期
中国重要会议论文全文数据库 前10条
1 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
2 赵敬华;高慧颖;魏军;;基于本体的商品信息查询系统与算法研究[A];中国企业运筹学[C];2009年
3 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
4 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 张桂平;蔡东风;徐立军;尹宝生;陈建军;;以互联网为知识源的基于语段分析的交互式机器翻译技术的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 庄成龙;钱龙华;周国栋;;基于树核函数的实体关系抽取方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 丁晟春;刘逶迤;熊霞;梅健;;基于领域本体和语块分析的信息抽取的研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 程晓;郑德权;杨宇航;邵国军;;面向半结构化文本的领域本体关系抽取[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 付瑞吉;秦兵;刘挺;;面向音乐领域的文本检索与挖掘系统[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
2 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
3 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
4 罗芳;意见挖掘中若干关键问题研究[D];武汉理工大学;2011年
5 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
6 许建潮;Web挖掘中若干问题的研究[D];吉林大学;2005年
7 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
8 于满泉;面向人物追踪的知识挖掘研究[D];中国科学院研究生院(计算技术研究所);2006年
9 俞晓晶;基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D];中国科学院研究生院(上海生命科学研究院);2006年
10 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
2 李小红;基于自举的弱指导中文语义关系抽取研究[D];苏州大学;2010年
3 季元叶;语言学特征在中文命名实体间语义关系抽取中的应用研究[D];苏州大学;2010年
4 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
5 钟鸿鹏;基于时态信息的网页排序系统的研究与实现[D];华南理工大学;2010年
6 谷文;基于概念树的Web信息抽取技术研究[D];长春工业大学;2010年
7 蒋子鹏;基于人机交互的英文动词聚类的研究[D];北京交通大学;2011年
8 张宜浩;基于最大熵模型的中文实体关系自动抽取研究[D];昆明理工大学;2010年
9 孟祥燕;问答对自动获取的研究[D];昆明理工大学;2008年
10 刘嵩;网络中文事件自动检测技术研究[D];解放军信息工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报;1998年01期
2 吴芬芬;刘磊;肖宪;;一种启发式的信息抽取算法[J];吉林大学学报(理学版);2007年01期
3 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
4 贺智平;徐学洲;李爱玲;;一种基于信息熵的Web页面主题信息抽取方法[J];计算机工程与应用;2007年04期
5 胡睿,张冬茉,杜蓬;基于结点语义关系的信息抽取技术[J];计算机工程;2001年04期
6 孔祥勇,张冬茉;一种信息抽取系统中汉语同指消解算法[J];计算机工程;2003年16期
7 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期
8 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
9 刘迁;焦慧;贾惠波;;信息抽取技术的发展现状及构建方法的研究[J];计算机应用研究;2007年07期
10 袁毓林;信息抽取的语义知识资源研究[J];中文信息学报;2002年05期
中国重要会议论文全文数据库 前1条
1 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
中国硕士学位论文全文数据库 前2条
1 徐超;基于种子自扩展的命名实体关系抽取方法的研究[D];华中师范大学;2006年
2 陈静;基于本体的信息抽取研究[D];苏州大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 李德华;波形模式匹配的一种加速算法[J];信息与控制;1982年04期
2 张晓华,陈宏钧,余四清,王卓军;一种新型模糊控制器在加热炉上的应用[J];冶金自动化;1991年05期
3 唐朝京,吴自强,王跃科,张南,周代英,王成友;一种基于改进的SEVQ匹配算法的汉语全音节语音识别系统[J];国防科技大学学报;1997年03期
4 应向荣;入侵检测(IDS)技术的发展[J];信息技术与标准化;2002年12期
5 高培焕,张大智;基于二维模式匹配的图像检索快速算法[J];辽宁师范大学学报(自然科学版);2002年02期
6 马志柔;叶屹;;一种有效的多关键词词频统计方法[J];计算机工程;2006年10期
7 黄健斌;姬红兵;孙鹤立;;多源Web对象与关系数据的集成[J];西安电子科技大学学报;2007年01期
8 柳景超;周立兵;;一个改进的入侵检测系统模型[J];计算机与数字工程;2007年01期
9 李昌清;李艳霞;李胜利;王剑;;基于动态异构的Web信息集成网页分析方法[J];计算机应用研究;2007年12期
10 陈小明;;基于模式匹配的协议分析技术研究[J];厦门教育学院学报;2007年04期
中国重要会议论文全文数据库 前10条
1 钱颖;聂俊岚;刘国华;郜时红;;基于全集的复杂模式匹配[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 孙江明;李通化;;基于模式匹配的蛋白质结构形状预测[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
3 王振宇;谭红叶;郑家恒;;基于Bootstrapping的交通工具名识别[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
4 谢丽聪;;基于Matchmaking方法的模式匹配[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
5 谭茂金;张庚骥;石耀霖;;阵列电法测井的垂直模式匹配理论研究[A];中国地球物理学会第二十四届年会论文集[C];2008年
6 王振宇;谭红叶;郑家恒;张虎;;交通工具名识别系统的设计与实现[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
7 陈建云;王跃科;刘辉;;基于相关分析和模式匹配的多普勒频率测量方法[A];第三次全国会员代表大会暨学术会议论文集[C];2002年
8 胡凤国;;一个简单人机对话系统的实现方法[A];第一届学生计算语言学研讨会论文集[C];2002年
9 朱艳;许家珆;;一种基于入侵检测的多模式匹配算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
10 唐波;;Ku频段波导双工器的设计[A];2007年全国微波毫米波会议论文集(下册)[C];2007年
中国重要报纸全文数据库 前10条
1 陈胜权;综合分析引擎提升UTM性能[N];中国计算机报;2007年
2 本报记者 边歆;泥上指爪印深痕[N];网络世界;2005年
3 上海 高博;让电脑“听懂”人话[N];电脑报;2008年
4 本报记者  张琳;怎样抵挡“零日”攻击[N];网络世界;2006年
5 ;IDS续存论对峙灭亡论[N];网络世界;2003年
6 张利;下一代搜索轮廓初现Autonomy力挺中文搜[N];中国企业报;2006年
7 ;下一代软硬件工具助力RFID[N];计算机世界;2006年
8 李宇;中国平安有权增持富通至4.99%[N];中国证券报;2007年
9 中南财经政法大学现代教育技术中心 李可;IDS何去何从[N];网络世界;2005年
10 奚嘉迪;后浪推前浪[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 庞引明;基于结构化联接的XML查询模式匹配关键技术研究[D];复旦大学;2004年
2 杨宏宇;网络入侵检测技术的研究[D];天津大学;2003年
3 杜小坤;数据库模式匹配算法研究[D];华中科技大学;2010年
4 于志宏;视频安全与网络安全若干问题研究[D];吉林大学;2009年
5 魏连鑫;多小波理论及其在虹膜识别技术中的应用[D];吉林大学;2006年
6 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
7 杜永萍;基于模式知识库的问题回答关键技术研究[D];复旦大学;2005年
8 明星;虹膜识别技术中小波变换的应用原理与方法[D];吉林大学;2006年
9 陈曙晖;基于内容分析的高速网络协议识别技术研究[D];国防科学技术大学;2007年
10 李奇越;网络内容分析中基于硬件的字符串匹配算法的研究[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 胡德华;Snort检测引擎的改进与实现[D];东北大学;2005年
2 陈鹏;基于模式匹配的网络入侵检测系统的研究与实现[D];湖南大学;2005年
3 张晓光;基于模式匹配的入侵检测系统应用研究[D];大连海事大学;2010年
4 陈雪林;基于Web的网络入侵检测系统设计与实现[D];成都理工大学;2004年
5 王兴义;基于模式匹配的中文专有名词识别[D];山西大学;2005年
6 张国权;基于模式匹配和协议分析的NIDS研究和设计[D];大连理工大学;2006年
7 刘少君;基于协议分析的网络入侵检测系统研究与设计[D];河海大学;2006年
8 邓庆锋;模式匹配在入侵检测系统中的应用[D];浙江大学;2006年
9 李韦韦;多层特征分配网络入侵检测系统[D];南昌大学;2007年
10 洪小丽;基于位并行技术的带通配符约束的模式匹配问题研究[D];合肥工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026