收藏本站
《电子科技大学学报》 2010年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

最大熵模型的事件分类

于江德  李学钰  樊孝忠  庞文博  
【摘要】:提出了一种基于最大熵模型的事件分类方法,该方法能够综合事件表述语句中的触发词信息及各类上下文特征对事件进行分类。对其中的两个关键问题:参数估计、特征模板与特征选择进行了详细论述,采用IIS算法学习模型参数,使用增量选择方法选择特征。应用该方法对人民日报语料中的职务变动、会见、恐怖袭击、法庭宣判、自然灾害五类事件进行了分类实验,结果表明,该方法的分类效果明显优于传统的分类方法。
【作者单位】安阳师范学院计算机与信息工程学院;北京理工大学计算机科学技术学院;
【基金】:教育部博士点基金(20050007023)
【分类号】:TP391.1
【正文快照】:
最近几年,信息抽取(information extraction)研究受到了越来越多的关注。事件信息抽取(简称事件抽取,event extraction)是从自然语言形式的文本中自动地抽取用户感兴趣的事件以及卷入其中的特定类型的实体,并将这些信息转换为结构化数据并存储到预定义模板的过程。例如,从新

【参考文献】
中国期刊全文数据库 前4条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 赵岩;王晓龙;刘秉权;关毅;;融合聚类触发对特征的最大熵词性标注模型[J];计算机研究与发展;2006年02期
3 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
4 李素建,刘群,杨志峰;基于最大熵模型的组块分析[J];计算机学报;2003年12期
中国重要会议论文全文数据库 前1条
1 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
【共引文献】
中国期刊全文数据库 前10条
1 钟彬彬,刘远超,徐志明;基于GA的文本子主题切分中的参数优化研究[J];计算机工程与应用;2005年21期
2 刘传汉;王永成;刘德荣;王志琪;;利用分割技术提高对话文本自动摘要的一致性[J];上海交通大学学报;2007年08期
3 陈文庆,李勤,姚伽华;基于最大熵模型的垃圾邮件过滤技术[J];广西师范学院学报(自然科学版);2005年01期
4 余正涛,樊孝忠,郭剑毅;基于支持向量机的汉语问句分类[J];华南理工大学学报(自然科学版);2005年09期
5 尚文倩;黄厚宽;刘玉玲;林永民;瞿有利;董红斌;;文本分类中基于基尼指数的特征选择算法研究[J];计算机研究与发展;2006年10期
6 李跃进;赵晶;林鸿飞;;基于Internet的军事演习信息抽取系统[J];计算机工程与应用;2006年14期
7 贾宁;;使用概念基元特征进行自动文本分类[J];计算机工程与应用;2007年01期
8 冯冲;陈肇雄;黄河燕;王江伟;;最大熵模型的树-栅格最优N解码算法[J];计算机科学;2005年10期
9 刘贵全;曾宇斌;;基于最大熵模型的汉语依存分析[J];计算机工程;2006年11期
10 崔彩霞;王素格;;基于粗集的支持向量机文本分类方法研究[J];科技广场;2006年08期
中国重要会议论文全文数据库 前10条
1 Na YE Jingbo ZHU Haitao LUO Huizhen WANG Bin ZHANG Natural Language Processing Laboratory, Institute of Computer Software and Theory Institute of Computer Applications;Improvement of the Dotplotting Method for Linear Text Segmentation[A];Proceedings of 2005 IEEE International Conference on Natural Language Processing and Knowledge Engineering[C];2005年
2 罗海涛;叶娜;朱靖波;;Dotplotting文本分割技术的分析与改进[A];第三届学生计算语言学研讨会论文集[C];2006年
3 朱海军;张桂平;蔡东风;王炜华;;科技论文的标题识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 钟茂生;;文本主题分割技术的研究进展[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 钟茂生;;自然语言中的对象及其处理[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 Yu Zhengtao~(1,2) Fan Xiaozhong~1 Song Lizhe~1 Guo Jianyi~2 1 Department of Computer Science & Engineering,Beijing Institute of Technology,Beijing,100081,China 2 The School of Information Engineering and Automation & Kunming University of Science and Technology,Kunming,650051,China;Chinese Question Classification Combining Syntactic and Semantic Feature[A];Proceedings of 6th International Symposium on Test and Measurement(Volume 6)[C];2005年
7 李素建;刘群;;基于混合模型的组块分析技术[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
8 方高林;于浩;;最大熵语言模型及其在模式识别中新的应用[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 谷波;刘开瑛;;决策树模型和最大熵模型在文本分类中的比较研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 张运良;张全;;概念优先组合判断研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
2 秦莉娟;基于内容的自动视频监控研究[D];浙江大学;2006年
3 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
4 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
5 刘启和;基于Rough集的知识发现及其在汉语处理中的应用[D];电子科技大学;2005年
6 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
7 孟静;光学层析图像的重建技术研究[D];苏州大学;2006年
8 古平;基于贝叶斯模型的文档分类及相关技术研究[D];重庆大学;2006年
9 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
10 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 常兴治;基于全局评价的文本分割技术研究[D];东北大学;2005年
2 李春亮;广告视频探测技术研究[D];国防科学技术大学;2004年
3 赵城利;基于Web的信息智能感知技术及应用[D];国防科学技术大学;2004年
4 崔彩霞;基于支持向量机的文本分类方法研究[D];山西大学;2005年
5 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
6 张瑞霞;基于语义的汉语句法分析系统的研究与实现[D];西北大学;2005年
7 马忠宝;基于支持向量机的中文文本分类系统研究[D];武汉理工大学;2006年
8 罗恒;应用条件随机场进行汉语词法分析、语块分析研究[D];兰州理工大学;2006年
9 杨军玲;汉语动词词语搭配自动获取方法研究[D];山西大学;2006年
10 陈鹏;基于语料库的维吾尔语词干提取和词性标注[D];新疆大学;2006年
【二级参考文献】
中国期刊全文数据库 前3条
1 李蓉,刘少辉,叶世伟,史忠植;基于SVM和k-NN结合的汉语交集型歧义切分方法[J];中文信息学报;2001年06期
2 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
3 赵军,黄昌宁;基于转换的汉语基本名词短语识别模型[J];中文信息学报;1999年02期
中国重要会议论文全文数据库 前1条
1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
【相似文献】
中国期刊全文数据库 前10条
1 于江德;肖新峰;樊孝忠;;基于隐马尔可夫模型的中文文本事件信息抽取[J];微电子学与计算机;2007年10期
2 许荣华;吴刚;李培峰;朱巧明;;基于事件框架的主题事件融合研究[J];计算机应用研究;2009年12期
3 于江德;樊孝忠;庞文博;;事件信息抽取中语义角色标注研究[J];计算机科学;2008年03期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026