收藏本站
《情报理论与实践》 2009年10期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

汉语信息抽取中事件的定位与分类

邓擘  郑彦宁  樊孝忠  
【摘要】:事件抽取是信息抽取的基本任务之一,而对文本中的事件准确定位和分类是保证事件抽取质量的前提。使用向量空间模型来表示事件描述片段的特征,并分类计算特征词的重要度,最后对文本中的事件片段进行定位和分类。试验结果表明该方法能够对文本中的事件片段进行较为准确的定位、分类,因此对于事件抽取任务的前期处理具有重要价值。
【作者单位】中国科学技术信息研究所;北京理工大学计算机系;
【关键词】信息抽取 事件描述 特征词 文本片段 重要度 向量空间模型 事件类 准确定位 分类 特征向量
【基金】:国家自然科学基金项目资助的研究成果之一,项目编号:70803048
【分类号】:TP391.1
【正文快照】:
信息抽取技术是对文本中特定领域或类别的事件进行抽取,将事件中的各个实体及其相互关系抽取出来,形成结构化的信息存储在数据库中。因此,在对事件文本进行信息抽取前,首先要对文本中的事件进行准确定位与分类。文献[1]中使用经过链接语法标注过的句子,并结合事件描述中出现

【相似文献】
中国期刊全文数据库 前10条
1 欧阳松;汉字编码的PTEC模型和计算机辅助设计[J];计算机学报;1988年09期
2 冉宇;浅谈新闻特写的开头[J];新闻爱好者;1992年05期
3 刘正捷;徐素文;张涛;;一个分布式程序图示化分析工具的设计实现[J];计算机工程与应用;1992年08期
4 张永奎;从文本中提取信息[J];情报学报;1994年02期
5 田明路;搞好电视新闻的批评报道[J];新闻战线;1994年02期
6 张卫宣;客户机工具PowerBuilder的开发及其应用[J];电讯技术;1995年04期
7 周传珍;第二讲 故障树分析(FTA)[J];质量与可靠性;1995年03期
8 熊建新,王鼎兴,郑纬民,沈美明;基于事件模型的可视化并行调试技术[J];软件学报;1996年05期
9 孙洪林;PowerBuilder使用入门 第二讲 在应用程序中增加对象[J];中国计算机用户;1996年10期
10 黄礼莲;Visual Basic for SQL Server中的Cursors剖析[J];微电脑世界;1996年03期
中国重要会议论文全文数据库 前10条
1 张伟;潘红华;孙优贤;;生产过程中混杂控制系统的分析与建模[A];1999中国控制与决策学术年会论文集[C];1999年
2 钱跃良;刘开瑛;;农作物模板自动生成的技术研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 房一飞;张冬茉;;基于boosting的文本分类在股市领域信息抽取系统中的应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 刘扬;俞士汶;;CCD构造模型及VACOL辅助软件的设计与实现[A];第一届学生计算语言学研讨会论文集[C];2002年
5 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 江荻;;现代藏语谓语动词的识别与信息提取[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
8 谌志群;张国煊;;一个基于内容的Web信息抽取方法[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
9 周剑辉;苑春法;黄锦辉;李文捷;;金融领域内信息抽取规则的自动获取[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
10 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 黄集伟;非虚构阅读[N];深圳商报;2001年
2 马志彦;悄然而至的EIP[N];中国计算机报;2002年
3 贾晓敏(作者系北京育民小学教师);爱党爱国永恒的主题[N];中国新闻出版报;2002年
4 李明;HIS系统中外有别[N];健康报;2003年
5 董振东;到用户中去[N];中国计算机报;2003年
6 江林强;CRM与期货客户关系管理[N];期货日报;2003年
7 本报记者 余戈;电脑为什么能战胜人脑[N];北京科技报;2004年
8 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
9 希安;微软试水信息检索[N];经济日报;2004年
10 彭芳;搜索也专业[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
2 张凯;基于本体的Web信息集成若干关键技术研究[D];复旦大学;2004年
3 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
4 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
5 胡明;Web中文信息智能获取与分类研究[D];吉林大学;2005年
6 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
7 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
8 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
9 袁方;面向智能信息检索的Web挖掘关键技术研究[D];东北大学;2006年
10 黄友平;贝叶斯网络研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 张绍华;基于实例的Web信息抽取[D];河北大学;2001年
2 翟蕾;Web文档分类及信息抽取的研究与开发[D];西北工业大学;2001年
3 蒋伟华;搜索引擎中的信息抽取技术研究[D];湖南大学;2001年
4 曹军;汉语第三人称代词消解方法研究[D];湘潭大学;2002年
5 陈丽;基于XML的知识集成中间件系统的研究与应用[D];南京航空航天大学;2003年
6 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
7 赵辄谦;基于互联网的中文问答系统研究[D];山西大学;2003年
8 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
9 陈少飞;Web信息抽取规则的优化及规则的XQuery表达[D];河北大学;2003年
10 刘建舟;术语自动抽取系统的设计及关键技术研究[D];华中师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026