收藏本站
《计算机应用研究》 2013年07期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于词频统计的组织机构名识别方法

胡万亭  杨燕  尹红风  贾真  刘利  
【摘要】:命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成词的词频统计。在此基础上,构建了数学模型,实现了组织机构名识别算法。该识别算法集成到了中文分词中,取得了较好的识别结果,可以满足一定的实际应用需求。

【参考文献】
中国期刊全文数据库 前7条
1 黄德根;李泽中;万如;;基于SVM和CRF的双层模型中文机构名识别[J];大连理工大学学报;2010年05期
2 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
3 胡文博;都云程;吕学强;施水才;;基于多层条件随机场的中文命名实体识别[J];计算机工程与应用;2009年01期
4 向晓雯,史晓东,曾华琳;一个统计与规则相结合的中文命名实体识别系统[J];计算机应用;2005年10期
5 陈霄;刘慧;陈玉泉;;基于支持向量机方法的中文组织机构名的识别[J];计算机应用研究;2008年02期
6 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
7 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期
中国重要会议论文全文数据库 前1条
1 雷静;;汉语机构名的构成模式[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【共引文献】
中国期刊全文数据库 前10条
1 付艳;杨冬青;唐世渭;伍伟;王腾蛟;高军;;基于实体识别的在线主题检测方法[J];北京大学学报(自然科学版);2009年02期
2 李玉森;张雪英;袁正午;;面向GIS的地理命名实体识别研究[J];重庆邮电大学学报(自然科学版);2008年06期
3 李建平;王慧强;卢爱平;郝洪亮;冯光升;;基于条件随机场的网络安全态势量化感知方法[J];传感器与微系统;2010年10期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 黄德根;李泽中;万如;;基于SVM和CRF的双层模型中文机构名识别[J];大连理工大学学报;2010年05期
6 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
7 张春菊;张雪英;朱少楠;徐希涛;;基于网络爬虫的地名数据库维护方法[J];地球信息科学学报;2011年04期
8 马颖华,王永成,苏贵洋;一种在汉语文本中抽取重复字串的快速算法[J];电子学报;2002年S1期
9 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
10 周顺先;林亚平;王耀南;易叶青;;基于二阶隐马尔可夫模型的文本信息抽取[J];电子学报;2007年11期
中国重要会议论文全文数据库 前10条
1 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 何正焱;王厚峰;;商品品牌名称挖掘[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
4 董俊林;聂伟;杨君英;张春炉;;命名实体识别与提取分析[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
5 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
6 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
7 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
2 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
3 蔡盈芳;基于本体的航空产品知识库构建研究[D];北京交通大学;2011年
4 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
5 吴承荣;骨干通道上的网络论坛通信信息监测和分析的关键技术研究[D];复旦大学;2011年
6 张浩;视频运动人体行为识别与分类方法研究[D];西安电子科技大学;2011年
7 刘朝涛;中文问答系统中的句型理论及其应用研究[D];重庆大学;2010年
8 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
9 汤步洲;序列标注问题的监督学习方法及应用[D];哈尔滨工业大学;2011年
10 刘运;DDoS Flooding攻击检测技术研究[D];国防科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
2 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
3 杨晓东;中文命名实体识别及若干相关问题的研究[D];江苏大学;2010年
4 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
5 韩露;领域知识对领域问答系统答案抽取影响研究[D];昆明理工大学;2008年
6 李英伟;基于增量改进贝叶斯领域问句分类研究[D];昆明理工大学;2009年
7 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
8 林冬盛;中文分词算法的研究与实现[D];西北大学;2011年
9 常卫丽;领域本体在中文命名实体识别中的应用研究[D];武汉理工大学;2011年
10 潘文彬;基于情感词词典的中文句子情感倾向分析[D];北京邮电大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 李丽双;黄德根;陈春荣;杨元生;;基于支持向量机的中文文本中地名识别[J];大连理工大学学报;2007年03期
2 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
3 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
4 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期
5 冯冲;陈肇雄;黄河燕;王江伟;;最大熵模型的树-栅格最优N解码算法[J];计算机科学;2005年10期
6 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
7 庄明,老松杨,吴玲达;一种统计和词性相结合的命名实体发现方法[J];计算机应用;2004年01期
8 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
9 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
10 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
中国重要会议论文全文数据库 前3条
1 季姮;罗振声;;基于反比概率模型和规则的中文姓名自动辨识系统[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国硕士学位论文全文数据库 前4条
1 乔羽;基于最大熵模型的中文人名识别方法研究[D];山西大学;2005年
2 陈晴;基于条件随机场的自动分词技术的研究[D];东北大学;2005年
3 王志强;基于条件随机域的中文命名实体识别研究[D];南京理工大学;2006年
4 郭家清;基于条件随机场的命名实体识别研究[D];沈阳航空工业学院;2007年
【相似文献】
中国期刊全文数据库 前10条
1 倪青;医学科研论文中统计方法的合理选择[J];编辑学报;1997年03期
2 刘美茹;吴岩;刘挺;王开铸;于明光;;用计算机对文章意义段划分初探[J];东北测绘;1997年04期
3 梁丽;张洋;黄亚明;;应用人工神经网络实现网络资源评价指标体系的重构[J];现代图书情报技术;2006年05期
4 顾健;;美国教育统计中心的大学图书馆统计[J];大学图书馆学报;2008年02期
5 刘杰;;基于改进的隐马尔科夫模型的中文命名实体识别算法[J];太原师范学院学报(自然科学版);2009年01期
6 郭玲;孟祥逢;张峰;;基于最大匹配法的中文分词技术改进[J];舰船电子工程;2009年12期
7 艳红;王斯日古楞;;基于HMM的蒙古文自动词性标注研究[J];内蒙古师范大学学报(自然科学汉文版);2010年02期
8 李薇;祖世强;许旭华;;质量管理技术在科技项目管理中的应用[J];信息技术;2010年12期
9 樊振宇;;软件故障度量方法[J];装备制造技术;2011年08期
10 史彦军,滕弘飞,金博;抄袭论文识别研究与进展[J];大连理工大学学报;2005年01期
中国重要会议论文全文数据库 前10条
1 邓爱明;张明荣;梅华生;;基于特征值的零构件疲劳可靠性统计方法[A];第七届全国MTS材料试验学术会议论文集(一)[C];2007年
2 吕先金;金建卓;陈小素;陈华文;;气象自记雨量资料推求城市暴雨强度公式[A];第四届长三角科技论坛论文集(下册)[C];2007年
3 王永军;董海卫;杨涛;;统计与结构并用的工程图纸符号识别方法[A];2001中国控制与决策学术年会论文集[C];2001年
4 刘克;穆丽颖;黎建强;;信用评估:确定贷款发放的一种方法[A];第三届不确定系统年会论文集[C];2005年
5 李炜明;朱宏平;夏勇;;基于车辆响应的桥梁结构参数的统计区间估计[A];第17届全国结构工程学术会议论文集(第Ⅰ册)[C];2008年
6 徐安玉;;四川科技期刊审读的分析[A];科技期刊编辑研究文集(第三集)[C];1994年
7 钟茂生;;自然语言中的对象及其处理[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 陈清;樊隽轩;;古生物多样性统计方法介绍和适用性分析[A];中国古生物学会第十次全国会员代表大会暨第25届学术年会——纪念中国古生物学会成立80周年论文摘要集[C];2009年
9 陶用之;鲍远圣;;社会调查研究中的统计方法[A];江苏省数量经济与管理学会学术会议论文集[C];2001年
10 张必隐;;中文双字词认知中的邻近词频率效果[A];第八届全国心理学学术会议文摘选集[C];1997年
中国重要报纸全文数据库 前10条
1 农调;国际耕地面积统计方法的启示[N];中国信息报;2002年
2 记者 方敏;上海离婚率激增20倍?[N];解放日报;2005年
3 记者 江涛;进一步提高统计数据质量[N];运城日报;2008年
4 记者 周英峰 刘铮;提高透明度,国家统计局“开门”听意见[N];新华每日电讯;2009年
5 本报记者 王海燕;让男女两性公平获得公共资源[N];解放日报;2010年
6 ;上海市积极探索新材料统计方法[N];中国信息报;2002年
7 本报驻美国记者 张孟军;统计方法应跟上知识经济步伐[N];科技日报;2006年
8 王海燕;上海将扩大分性别统计覆盖范围[N];中国妇女报;2010年
9 本报记者 陆娅楠;我该相信谁的调查[N];人民日报;2011年
10 赵怡;特殊行业经营考核与统计方法的探讨[N];财会信报;2005年
中国博士学位论文全文数据库 前10条
1 王占宏;基于扫描统计方法的上海犯罪时空热点分析[D];华东师范大学;2013年
2 温永仙;禾谷类作物胚乳性状QTL定位方法研究[D];福建农林大学;2007年
3 付连艳;处理效应评估的统计方法[D];东北师范大学;2011年
4 殷瑞飞;数据挖掘中的聚类方法及其应用[D];厦门大学;2008年
5 谷照升;水库湖泊水质分析、模拟与预测的综合数学方法及其应用[D];吉林大学;2006年
6 杨梅;现代汉语合成词构词研究[D];南京师范大学;2006年
7 曹雯;秋冬季南方单栋塑料温室小气候分析与温湿环境模拟研究[D];南京信息工程大学;2012年
8 张志彬;伽玛射线暴单脉冲光变曲线的研究[D];中国科学院研究生院(云南天文台);2006年
9 李万清;风沙跃移运动的粒—床随机碰撞数值模拟研究[D];兰州大学;2007年
10 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 李艳淑;南京盐业公司质量管理体系研究[D];南京理工大学;2004年
2 崔晓红;伽玛暴能谱性质和喷流结构模型的统计研究[D];中国科学院研究生院(云南天文台);2005年
3 魏红州;煤矿事故人因失误因素的灰色模糊分析与研究[D];太原理工大学;2007年
4 小坂克子(久保克子);基于统计分析的对吴昌硕篆刻的考察[D];中国美术学院;2008年
5 于宏斌;基于HMM/DTW相结合的二级签名认证算法的研究[D];中国科学技术大学;2009年
6 张茜;基于动态纹理的流水效果合成技术研究[D];山东大学;2006年
7 张军;大学新生应激的相关社会心理因素及统计技术研究[D];福建医科大学;2006年
8 沙晓婷;统计方法在软件测试中的研究与实现[D];北京交通大学;2008年
9 郭庆贺;中文文本姓名识别的研究[D];东北师范大学;2009年
10 刘爽;运行态软件测试技术研究[D];上海交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026