收藏本站
《计算机应用与软件》 2011年08期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

事件信息抽取中的数据预处理方法研究

孙中友  李培峰  朱巧明  
【摘要】:事件抽取是信息抽取领域的一个重要研究方向。针对事件抽取获得的信息不完整、语义不明确、元素表达多样性及明显事件冗余等问题,提出基于统计的缺失数据填充算法,使丢失信息的事件完备化;同时提出基于规则和词典的事件元素规格化将不同表述的事件统一化,通过事件真伪辨别解决了语义不明确问题,修正抽取不正确的事件,并过滤掉明显冗余信息的事件。
【作者单位】苏州大学计算机科学与技术学院;
【关键词】事件抽取 元素规格化 不完备信息处理
【基金】:国家自然科学基金(60873150,60970056) 江苏省自然科学基金(BK2008160) 江苏省高校自然科学重大基础研究项目(08KJA520002)
【分类号】:TP391.1
【正文快照】:
0引言认知科学家们认为,事件是人们认识和理解世界的基础,符合人们的正常认知规律[1]。目前,事件信息抽取Events IE(Events Information Extraction)是信息抽取领域的研究热点之一,在自动文摘、自动问答、信息检索等领域有着广泛的应用。事件抽取主要是从一个语句或句群中提

【共引文献】
中国博士学位论文全文数据库 前1条
1 周文;基于概念的若干知识表示模型及相关方法研究[D];上海大学;2007年
【二级参考文献】
中国期刊全文数据库 前6条
1 周文;刘宗田;陈慧琼;;FCA与本体结合研究的综述[J];计算机科学;2006年02期
2 鲁松,白硕;自然语言处理中词语上下文有效范围的定量描述[J];计算机学报;2001年07期
3 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
4 梁晗;陈群秀;吴平博;;基于事件框架的信息抽取系统[J];中文信息学报;2006年02期
5 王琪,王丽萍,陈凯迪;一种简单的图案填充算法[J];微计算机信息;2005年17期
6 王寅;事件域认知模型及其解释力[J];现代外语;2005年01期
中国博士学位论文全文数据库 前1条
1 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
【相似文献】
中国期刊全文数据库 前10条
1 许荣华;吴刚;李培峰;朱巧明;;基于指代消解的中文事件融合方法[J];计算机应用;2009年08期
2 付剑锋;刘宗田;刘炜;单建芳;;基于特征加权的事件要素识别[J];计算机科学;2010年03期
3 许旭阳;韩永峰;宋文政;;事件抽取技术的回顾与展望[J];信息工程大学学报;2011年01期
4 许红磊;陈锦秀;周昌乐;林如琦;杨肖方;;自动识别事件类别的中文事件抽取技术研究[J];心智与计算;2010年01期
5 丁效;宋凡;秦兵;刘挺;;音乐领域典型事件抽取方法研究[J];中文信息学报;2011年02期
6 吴刚;许荣华;朱巧明;李培峰;钱培德;;一种基于角色匹配的事件抽取方法[J];微计算机信息;2010年09期
7 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[J];中文信息学报;2008年01期
8 赵小明;朱洪波;陈黎;王亚强;秦湘清;于中华;;基于多分类器的金融领域多元关系信息抽取算法[J];计算机工程与设计;2011年07期
9 许旭阳;李弼程;张先飞;韩永峰;;基于事件实例驱动的新闻文本事件抽取[J];计算机科学;2011年08期
10 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
中国重要会议论文全文数据库 前4条
1 赵妍妍;秦兵;车万翔;刘挺;;中文事件抽取技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
3 曾青青;杨尔弘;朱丹青;;基于信息结构的突发事件文本事件信息自动抽取策略研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 孟雷;丁效;秦兵;刘挺;;基于依存句法和短语结构句法结合的金融领域事件元素抽取[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前1条
1 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
中国硕士学位论文全文数据库 前10条
1 吴刚;基于主题的中文事件抽取技术研究及应用[D];苏州大学;2009年
2 陈小陆;人物言论抽取与跟踪技术研究[D];哈尔滨工业大学;2008年
3 冯二波;领域实体属性及事件抽取技术研究[D];哈尔滨工业大学;2008年
4 赵妍妍;中文事件抽取的相关技术研究[D];哈尔滨工业大学;2007年
5 张剑峰;微博主观性发现关键技术研究[D];苏州大学;2012年
6 丁效;句子级中文事件抽取关键技术研究[D];哈尔滨工业大学;2011年
7 侯立斌;中文事件抽取与缺失角色填充的研究[D];苏州大学;2012年
8 李婷玉;基于语义的文本事件信息抽取方法的研究与实现[D];上海交通大学;2012年
9 许旭阳;网络新闻多文档自动摘要技术研究[D];解放军信息工程大学;2011年
10 董萍;基于知网语义关系的中文事件信息抽取研究[D];西安电子科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026