收藏本站
《计算机工程与应用》 2009年32期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

采用CRF技术的军事情报术语自动抽取研究

贾美英  杨炳儒  郑德权  杨靖  
【摘要】:针对军事情报领域,提出了一种基于条件随机场的术语抽取方法,该方法将领域术语抽取看作一个序列标注问题,将领域术语分布的特征量化作为训练的特征,利用CRF工具包训练出一个领域术语特征模板,然后利用该模板进行领域术语抽取。实验采用的训练语料来自"搜狐网络军事频道"的新闻数据,测试语料选取《现代军事》杂志2007年第1~8期的所有文章。实验取得了良好的结果,准确率为73.24%,召回率为69.57%,F-测度为71.36%,表明该方法简单易行,且具有领域通用性。

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 何婷婷;张勇;;基于质子串分解的中文术语自动抽取[J];计算机工程;2006年23期
2 张艳,宗成庆,徐波;汉语术语定义的结构分析和提取[J];中文信息学报;2003年06期
【共引文献】
中国期刊全文数据库 前1条
1 许勇,荀恩东,贾爱平,宋柔;基于互连网的术语定义获取系统[J];中文信息学报;2004年04期
中国重要会议论文全文数据库 前1条
1 王强军;张普;;基于DCC的术语定义标注语料库研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前5条
1 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
2 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
3 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
4 段建勇;多词表达抽取及其应用[D];上海交通大学;2007年
5 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前3条
1 廖青松;从劳动争议分类看我国现行劳动争议处理机制[D];湘潭大学;2007年
2 陈昌熊;复合词分析及其在信息检索中的应用[D];上海交通大学;2008年
3 陈珂;构造领域本体概念关系的自动抽取[D];上海交通大学;2008年
【同被引文献】
中国期刊全文数据库 前10条
1 费洪晓,康松林,朱小娟,谢文彪;基于词频统计的中文分词的研究[J];计算机工程与应用;2005年07期
2 孙茂松,肖明,邹嘉彦;基于无指导学习策略的无词表条件下的汉语自动分词[J];计算机学报;2004年06期
3 张华平,刘群;基于N-最短路径方法的中文词语粗分模型[J];中文信息学报;2002年05期
4 赵曾贻,陈天娥,朱兰;一种基于语词的分词方法[J];苏州大学学报(自然科学版);2002年03期
5 张春霞,郝天永;汉语自动分词的研究现状与困难[J];系统仿真学报;2005年01期
6 刘开瑛;现代汉语自动分词评测技术研究[J];语言文字应用;1997年01期
7 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
8 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
9 索红光;杨涛;;基于互信息的Web文档聚类方法[J];广西师范大学学报(自然科学版);2007年02期
10 李维刚;刘挺;张宇;李生;;基于长度和位置信息的双语句子对齐方法[J];哈尔滨工业大学学报;2006年05期
中国博士学位论文全文数据库 前1条
1 张榕;术语定义抽取、聚类与术语识别研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前9条
1 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
2 刘建舟;术语自动抽取系统的设计及关键技术研究[D];华中师范大学;2004年
3 梁以敏;基于统计的汉语词性标注方法的研究[D];大连理工大学;2004年
4 黄瑞;基于KDD的知识自动获取及其应用[D];南京信息工程大学;2005年
5 张勇;中文术语自动抽取相关方法研究[D];华中师范大学;2006年
6 郭红梅;双语对齐技术研究[D];北京邮电大学;2006年
7 许顺;中文分词规范可计算化的研究与实现[D];苏州大学;2006年
8 廖先桃;中文命名实体识别方法研究[D];哈尔滨工业大学;2006年
9 王可为;基于统计的双语术语自动抽取[D];南京理工大学;2007年
【二级参考文献】
中国重要会议论文全文数据库 前1条
1 刘建舟;何婷婷;姬东鸿;刘晓华;;基于开放式语料的汉语术语的自动抽取[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
【相似文献】
中国期刊全文数据库 前10条
1 朱莎莎;刘宗田;付剑锋;朱芳;;基于条件随机场的中文时间短语识别[J];计算机工程;2011年15期
2 刘莉;何中市;邢欣来;毛小丽;;基于语义角色的中文时间表达式识别[J];计算机应用研究;2011年07期
3 张春元;;基于条件随机场的文本分类模型[J];计算机技术与发展;2011年07期
4 刘里;刘小明;;基于分隔符和上下文术语的领域现象术语抽取[J];华南理工大学学报(自然科学版);2011年07期
5 于江德;谷川;葛文英;樊孝忠;;一种基于字和子串联合标注的汉语分词方法[J];山西大学学报(自然科学版);2011年03期
6 康旭珍;李茹;李双红;;框架元素语义核心词自动识别研究[J];中文信息学报;2011年04期
7 阳维;张树恒;王莲芸;张素;;基于图像块分类器和条件随机场的显微图像分割[J];计算机应用;2011年08期
8 谷俊;王昊;;基于领域中文文本的术语抽取方法研究[J];现代图书情报技术;2011年04期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 王海雄;郭剑毅;余正涛;毛存礼;张朝胜;雷春雅;;基于CRFs的中文领域术语自动抽取研究[A];第六届全国信息检索学术会议论文集[C];2010年
2 代翠;周俏丽;蔡东风;;统计和规则相结合的汉语最长名词短语自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 ;Automatic Domain-specific Term Extraction System Based on Hybrid Approaches[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
5 王东波;陈小荷;年洪东;;基于条件随机场的有标记联合结构自动识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
6 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 冯元勇;孙乐;张大鲲;李文波;;基于单字提示特征的中文命名实体识别快速算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 邱艳霞;余正涛;张志坤;司圣涛;韩露;孟祥燕;;领域术语自动抽取方法研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
9 章成志;王惠临;;基于专业领域平行语料的双语核心术语抽取研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 计峰;高沫;邱锡鹏;黄萱菁;;中文机构名简称的自动生成研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
中国博士学位论文全文数据库 前10条
1 周浪;中文术语抽取若干问题研究[D];南京理工大学;2010年
2 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
3 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
4 禇一平;基于条件随机场模型的视频目标分割算法研究[D];浙江大学;2007年
5 许红涛;Web图像语义分析与自动标注研究[D];复旦大学;2009年
6 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
7 张奇;细颗粒度情感倾向分析若干关键问题研究[D];复旦大学;2008年
8 郁生阳;基于能量最小化图割的图像与视频目标精确分割研究[D];上海交通大学;2009年
9 任柯燕;基于机器视觉的室外场景图像理解方法研究[D];北京邮电大学;2012年
10 闫乐林;基于视听信息的视频语义分析与检索技术研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘磊;面向专利的双语术语自动抽取技术的研究[D];沈阳航空工业学院;2009年
2 李丹;特定领域中文术语抽取[D];大连理工大学;2011年
3 赵欣;基于最大熵的中文术语抽取系统的设计与实现[D];西安电子科技大学;2012年
4 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
5 柴桦;基于视频的人体运动识别方法研究[D];中南大学;2008年
6 段国成;基于CCD的术语抽取研究[D];郑州大学;2007年
7 唐涛;面向特定领域的中文分词技术的研究[D];沈阳航空航天大学;2012年
8 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
9 刘海鹏;面向手机短信的命名实体识别研究[D];北京邮电大学;2009年
10 苗雪雷;基于条件随机场的汉语词义消歧方法研究[D];沈阳航空工业学院;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026