收藏本站
《中文信息学报》 2002年02期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

中文金融新闻中公司名的识别

王宁  葛瑞芳  苑春法  黄锦辉  李文捷  
【摘要】:在金融领域信息抽取中 ,公司名扮演着非常重要的角色 ;因此如何正确识别文本中出现的公司名是一个非常重要的研究课题。在对金融新闻文本进行了深入地分析和研究的基础上 ,总结出了公司名的结构特征及其上下文信息 ,建立了六个用于识别公司名的知识库 ,并提出了一个基于两次扫描过程的识别策略。初步实验结果表明 ,在封闭测试中实验系统公司名识别的精确率可以达到 97 3% ,召回率可达 89 3% ;在开放测试中精确率可以达到 6 2 8% ,召回率可达 6 2 1%。

手机知网App
【引证文献】
中国期刊全文数据库 前4条
1 庄明,老松杨,吴玲达;一种统计和词性相结合的命名实体发现方法[J];计算机应用;2004年01期
2 钟良伍;郑方;;基于中文机构名简称的检索方法研究[J];中文信息学报;2007年01期
3 张占英,王中立;中文文本中公司名简称的识别[J];许昌学院学报;2003年02期
4 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期
中国重要会议论文全文数据库 前8条
1 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
3 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 乔春庚;肖诗斌;孙丽华;施水才;;规则与统计相结合的案件名称识别[A];第三届学生计算语言学研讨会论文集[C];2006年
5 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 陈慧;张普;;基于DCC动态流通语料库的中文组织名监测与研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国硕士学位论文全文数据库 前10条
1 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
2 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
3 吴雪军;面向信息抽取的命名实体识别与模板获取技术研究[D];东北大学;2005年
4 王江伟;基于最大熵模型的中文命名实体识别[D];南京理工大学;2005年
5 王兴义;基于模式匹配的中文专有名词识别[D];山西大学;2005年
6 庄明;装备发展战略研究信息化平台中汉语文本信息提取技术的研究[D];国防科学技术大学;2003年
7 陈霄;基于支持向量机的中文组织机构名识别[D];上海交通大学;2007年
8 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
9 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
10 朱江涛;中文信息处理中命名实体识别问题的研究[D];沈阳航空工业学院;2006年
【参考文献】
中国期刊全文数据库 前1条
1 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
【共引文献】
中国期刊全文数据库 前10条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
3 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
4 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
5 郑家恒,张辉;基于HMM的中国组织机构名自动识别[J];计算机应用;2002年11期
6 王桂平,林鹏;基于双侧语料评价模型的专业词汇识别算法[J];计算机与现代化;2005年09期
7 韩客松,王永成,陈桂林;无词典高频字串快速提取和统计算法研究[J];中文信息学报;2001年02期
8 金翔宇,孙正兴,张福炎;一种中文文档的非受限无词典抽词方法[J];中文信息学报;2001年06期
9 钟良伍;郑方;;基于中文机构名简称的检索方法研究[J];中文信息学报;2007年01期
10 王建新!100876;我国在语料库语言学研究方面的部分进展(概述)[J];外语与外语教学;1999年03期
中国重要会议论文全文数据库 前1条
1 余军;陈晓鸥;;命名实体识别:One-at-a-time or All-at-once?Word-based or Character-based?[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前6条
1 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
2 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
3 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
4 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
5 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
6 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 张晗;日文文节切分中的姓名识别[D];大连理工大学;2000年
3 王省;基地统计和规则的中文姓名识别系统的研制[D];大连理工大学;2000年
4 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
5 许勇;基于百科词典的知识获取系统的研究与实现[D];北京工业大学;2001年
6 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
7 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
8 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
9 林鹏;汉语疑问句理解系统研究与实现——虚拟信息顾问系统之问题理解子系统[D];重庆大学;2004年
10 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 张普;关于控制论与动态语言知识更新的思考[J];语言文字应用;2001年04期
2 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
3 刘芳,赵铁军,于浩,杨沐昀,方高林;基于统计的汉语组块分析[J];中文信息学报;2000年06期
4 李凯,黄厚宽;支持向量机增量学习算法研究[J];北方交通大学学报;2003年05期
5 胡俊峰,俞士汶;唐宋诗之计算机辅助深层研究[J];北京大学学报(自然科学版);2001年05期
6 来新夏;中国地方志的史料价值及其利用[J];国家图书馆学刊;2005年01期
7 钟义信;面向智能研究的全信息理论——纪念Shannon信息论50周年[J];北京邮电大学学报;1998年04期
8 李军,彭凯,李琦,郭玲玲;基于数字北京的空间信息工程的建设与实践[J];测绘科学;2005年01期
9 陆俭明;;要重视特征的研究与描写[J];长江学术;2006年01期
10 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报(自然科学版);2003年06期
中国重要会议论文全文数据库 前1条
1 俞鸿魁;张华平;刘群;;基于角色标注的中文机构名识别[A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages[C];2003年
中国博士学位论文全文数据库 前7条
1 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
2 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
3 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
4 谢能付;基于语义Web技术的知识融合和同步方法研究[D];中国科学院研究生院(计算技术研究所);2006年
5 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
6 常娥;古籍智能处理技术研究[D];南京农业大学;2007年
7 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
2 吕玥;天津商店命名的社会语言学考察和研究[D];天津师范大学;2002年
3 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
4 李盛;面向真实文本的汉语词义排歧系统[D];山西大学;2003年
5 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
6 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
7 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
8 荆涛;基于后缀数组的Web用户访问模式高效挖掘算法[D];吉林大学;2005年
9 乔羽;基于最大熵模型的中文人名识别方法研究[D];山西大学;2005年
10 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
【二级引证文献】
中国期刊全文数据库 前3条
1 王昊;;基于层次模式匹配的命名实体识别模型[J];现代图书情报技术;2007年05期
2 向晓雯,史晓东,曾华琳;一个统计与规则相结合的中文命名实体识别系统[J];计算机应用;2005年10期
3 顾铮;顾平;;信息抽取技术在中医研究中的应用[J];医学信息;2007年01期
中国重要会议论文全文数据库 前2条
1 高嵩;周强;;一种中文分词后处理反馈算法[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
2 塞麦提·麦麦提敏;亚森·伊明;;基于转换规则的汉文—维文专有名词自动翻译研究[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前3条
1 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
2 傅魁;基于Web的本体学习研究[D];武汉理工大学;2007年
3 孙凌云;面向产品概念设计的专利地图技术研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 吴芬芬;信息抽取算法研究[D];吉林大学;2006年
2 王思力;面向大规模信息检索的中文分词技术研究[D];中国科学院研究生院(计算技术研究所);2006年
3 王蕾;基于转换学习的专有名词识别[D];苏州大学;2006年
4 张剑;基于CRF的英文命名实体识别研究[D];哈尔滨工业大学;2006年
5 廖先桃;中文命名实体识别方法研究[D];哈尔滨工业大学;2006年
6 邹纲;中文新词语自动检测研究[D];中国科学院研究生院(计算技术研究所);2004年
7 杨德来;SVM和最大熵相结合的中文机构名自动识别[D];大连理工大学;2006年
8 陈霄;基于支持向量机的中文组织机构名识别[D];上海交通大学;2007年
9 向晓雯;基于条件随机场的中文命名实体识别[D];厦门大学;2006年
10 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 张小衡;从“qinghuadaxue”谈起逐步实现中文智能输入[J];中文信息;1996年05期
【相似文献】
中国期刊全文数据库 前10条
1 冯华魁;;云下单,云收货[J];销售与市场(渠道版);2011年08期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前7条
1 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 张玥杰;徐智婷;钱晶;张涛;;自然语言处理中专名识别方法的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 徐薇;付滨;刘柳;苑春法;李文捷;;中文命名实体识别系统的领域扩展[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 罗智勇;宋柔;荀恩东;;一种基于可信度的人名识别方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
5 宋柔;邹嘉彦;;汉语专名的初步研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
6 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 叶娜;吴雪军;朱靖波;陈文亮;;基于相似计算的信息抽取模板自动获取方法[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国重要报纸全文数据库 前8条
1 安徽 dream;用“双行合一”快速制作公文落款[N];电脑报;2004年
2 张琰珺;独资后,看NEC-AS如何“变天”[N];中国计算机报;2006年
3 雨青;Word中的“一呼百应”[N];计算机世界;2004年
4 田梦;Google加入Linux组织助开源一臂之力[N];计算机世界;2007年
5 杨国强;金山总裁兼CEO雷军:要让金山的苦难越来越少[N];第一财经日报;2007年
6 朱艳燕;TCS成立中国合资公司[N];中华工商时报;2007年
7 云南 仪淑英;系统集成报价不再愁[N];电脑报;2004年
8 本报记者 侯继勇;“3Q”再度擦枪走火 腾讯入股金山网络补缺[N];21世纪经济报道;2011年
中国硕士学位论文全文数据库 前3条
1 李卫亮;现代汉语分词系统中专名识别的实用策略[D];北京工业大学;2000年
2 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
3 王兴义;基于模式匹配的中文专有名词识别[D];山西大学;2005年
中国知网广告投放
相关期刊
>销售与市场(渠道版)
相关作者
>冯华魁
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026