收藏本站
《电脑开发与应用》 2002年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

中国组织机构名自动识别系统的设计与实现

张辉  徐健  
【摘要】:以搜狐网站的 2 0 0 0年 11~ 12月人民日报网页中涉及社会、经济、法律等内容的 5 0万汉字语料为基础 ,首先利用基于隐马尔可夫模型进行初识别 ,然后建立了一定规模的规则集 ,实现了中国组织机构名自动识别系统。经测试准确率达 89% ,召回率为 94 .5 %。

【引证文献】
中国期刊全文数据库 前6条
1 郑炜冬;;多种方法融合的中文自动分词系统的设计与实现[J];韩山师范学院学报;2009年06期
2 韦向峰;张全;吴晨;袁毅;;中文问答系统中机构名的处理[J];计算机工程与应用;2008年07期
3 王蕾;杨季文;;汉语未登录词识别现状及一种新识别方法介绍[J];计算机应用与软件;2007年08期
4 王睿,张洁,张由仪,于禛,姚天昉;基于混合模型的中文命名实体抽取系统[J];清华大学学报(自然科学版);2005年S1期
5 郭文龙;;数据清洗中中文地址分词技术研究[J];齐齐哈尔大学学报(自然科学版);2012年05期
6 柯修;王惠临;于薇;;基于串频统计的汉语和孟加拉语专有名词识别[J];现代图书情报技术;2011年12期
中国硕士学位论文全文数据库 前8条
1 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
2 王蕾;基于转换学习的专有名词识别[D];苏州大学;2006年
3 杨德来;SVM和最大熵相结合的中文机构名自动识别[D];大连理工大学;2006年
4 陈霄;基于支持向量机的中文组织机构名识别[D];上海交通大学;2007年
5 万如;中文机构名识别的研究[D];大连理工大学;2008年
6 和雪娟;基于统计和规则混合策略的中国人名识别研究[D];云南师范大学;2007年
7 乌兰敖日格乐;中文军事组织机构名的识别[D];大连理工大学;2010年
8 施建凤;基于NSP和CRFs双层模型的专有名词识别方法[D];河北大学;2010年
【参考文献】
中国期刊全文数据库 前1条
1 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
【共引文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 李玉森;张雪英;袁正午;;面向GIS的地理命名实体识别研究[J];重庆邮电大学学报(自然科学版);2008年06期
3 陈晓明;梁雄友;;一种实用的PCFG多阶段全局寻优句法分析算法[J];长春理工大学学报(自然科学版);2010年02期
4 马照亭;李志刚;孙伟;印洁;;一种基于地址分词的自动地理编码算法[J];测绘通报;2011年02期
5 王海静;;俗语语料库与语典编纂相关问题的思考[J];辞书研究;2011年04期
6 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
7 黄德根;李泽中;万如;;基于SVM和CRF的双层模型中文机构名识别[J];大连理工大学学报;2010年05期
8 马创新;李斌;;基于VC++的人工分词及词性标注辅助程序设计与实现[J];电脑编程技巧与维护;2011年01期
9 杜永萍,郑家恒;分词及词性标注一致性校对系统的设计与实现[J];电脑开发与应用;2001年10期
10 钱揖丽,郑家恒;中文文本词性自动校对系统的实现[J];电脑开发与应用;2004年01期
中国重要会议论文全文数据库 前10条
1 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
2 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
3 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
4 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
5 戴祖旭;洪帆;;基于词性标记文法的文本信息隐藏算法[A];第四届中国软件工程大会论文集[C];2007年
6 张霄军;;“长安”的同名地名自动识别与指代消解[A];陕西省社会科学界第二届(2008)学术年会——青年博士论坛“陕西新起点:创新·发展·民生”专题获奖论文选编[C];2008年
7 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
9 郭志立;;使用互信息辅助在篇章范围内识别命名实体[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 李斌;;中文单字国名简称的自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
2 吴戈;基于数字水印的文本信息隐藏方法的研究[D];长春理工大学;2011年
3 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
4 朱锁玲;命名实体识别在方志内容挖掘中的应用研究[D];南京农业大学;2011年
5 张蕾;概念结构及其应用[D];西北工业大学;2001年
6 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
7 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
8 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
9 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
10 刘伟;现代汉语代词隐现的动态研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 冯海瑛;《万历野获编》分词理论与实践[D];广西师范学院;2010年
2 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年
3 王东亮;基于条件随机场模型的中文人名识别的研究[D];大连理工大学;2010年
4 廖文平;基于CRF的中文地名识别研究[D];大连理工大学;2010年
5 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
6 潘正高;基于内容的Web新闻文本自动分类问题研究[D];合肥工业大学;2010年
7 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
8 苏俊峰;基于HMM的藏语语料库词性自动标注研究[D];西北民族大学;2010年
9 杨晓东;中文命名实体识别及若干相关问题的研究[D];江苏大学;2010年
10 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 骆正华,樊孝忠,刘林,龚永罡;基于E-Chunk的问句实例分析系统[J];北京理工大学学报;2005年01期
2 史永刚;左志宏;;决策树在中文姓名信息提取中的应用研究[J];成都信息工程学院学报;2006年02期
3 孙宏林,俞士汶;浅层句法分析方法概述[J];当代语言学;2000年02期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期
6 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
7 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
8 李丽双;黄德根;陈春荣;杨元生;;基于支持向量机的中文文本中地名识别[J];大连理工大学学报;2007年03期
9 高国洋;戚银城;潘德锋;;基于条件随机场与规则相结合的中文地名识别[J];电脑开发与应用;2009年08期
10 肖菁,商卫东;XML——新一代Web标记语言[J];电脑与信息技术;1999年03期
中国重要会议论文全文数据库 前4条
1 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 史树敏;王志强;周浪;冯冲;黄河燕;;基于条件随机域的中文命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
4 陈禹;史晓东;向晓雯;张润延;;基于混合方法的中文命名实体识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国硕士学位论文全文数据库 前5条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
3 王兴义;基于模式匹配的中文专有名词识别[D];山西大学;2005年
4 吴雪军;面向信息抽取的命名实体识别与模板获取技术研究[D];东北大学;2005年
5 毛婷婷;中文专有名词识别的研究[D];大连理工大学;2006年
【二级引证文献】
中国期刊全文数据库 前10条
1 曹恒;张茜;;农作物信息垂直搜索引擎的研究[J];安徽农业科学;2012年19期
2 朱颖;;浅谈HMM在词性标注中的应用[J];电脑开发与应用;2011年03期
3 荆涛;左万利;孙吉贵;车海燕;;中文网页语义标注:由句子到RDF表示[J];计算机研究与发展;2008年07期
4 肖洪;薛德军;;基于大规模真实文本的数值知识元挖掘研究[J];计算机工程与应用;2008年30期
5 冯鲸华;古丽拉·阿东别克;玛依来·哈帕尔;;基于N-gram语言模型的哈萨克文机构名识别[J];计算机工程与应用;2010年31期
6 陈钊;李嘉;;基于语义的林产品贸易文本信息结构化研究[J];计算机工程;2011年20期
7 尹驰东;黄生叶;鄂智丰;;寻路算法在中文金融机构名匹配中的应用[J];计算技术与自动化;2011年02期
8 薛征山;郭剑毅;余正涛;张志坤;姚贤明;;基于HMM的中文旅游景点的识别[J];昆明理工大学学报(理工版);2009年06期
9 车海燕;孙吉贵;荆涛;白曦;;一个基于本体主题的中文知识获取方法[J];计算机科学与探索;2007年02期
10 车万翔;张梅山;刘挺;;基于主动学习的中文依存句法分析[J];中文信息学报;2012年02期
中国重要会议论文全文数据库 前2条
1 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 王海雄;郭剑毅;余正涛;毛存礼;张朝胜;雷春雅;;基于CRFs的中文领域术语自动抽取研究[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前3条
1 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
2 孙凌云;面向产品概念设计的专利地图技术研究[D];浙江大学;2008年
3 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
中国硕士学位论文全文数据库 前10条
1 杨晓东;中文命名实体识别及若干相关问题的研究[D];江苏大学;2010年
2 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
3 吴广财;HMM增量学习算法在中文命名实体识别中的应用研究[D];华南理工大学;2011年
4 王秋红;极小化标注的海洋文献复杂分类[D];中国海洋大学;2011年
5 刘莎莎;大规模中文机构名称与机构地址自动翻译研究[D];哈尔滨工业大学;2010年
6 季念星;基于信息抽取技术的商业社会网络创建研究[D];哈尔滨工业大学;2010年
7 张佳宝;基于条件随机场的中文命名实体识别研究[D];国防科学技术大学;2010年
8 陈鑫;基于主动学习的汉语依存树库构建[D];哈尔滨工业大学;2011年
9 荆明明;基于Android的个性化RSS订阅系统的设计与实现[D];哈尔滨工业大学;2011年
10 吴瑞诚;面向行业搜索引擎的研究与实现[D];华中科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前1条
1 张小衡;从“qinghuadaxue”谈起逐步实现中文智能输入[J];中文信息;1996年05期
【相似文献】
中国期刊全文数据库 前10条
1 郑家恒,张辉;基于HMM的中国组织机构名自动识别[J];计算机应用;2002年11期
2 ;(二)与清洗有关的组织机构名称[J];洗净技术;2004年03期
3 ;四川省图书馆学会理事会名单及组织机构名单[J];四川图书馆学报;1979年01期
4 杨兵,谢维信;基于基因算法的隐马尔可夫模型参数估计[J];系统工程与电子技术;2002年07期
5 尹宝才;李敬华;贾熹滨;孙艳丰;;基于两层隐马尔可夫模型的可视语音合成[J];北京工业大学学报;2006年05期
6 周顺先;林亚平;王耀南;;基于主动学习隐马尔可夫模型的文本信息抽取[J];湖南大学学报(自然科学版);2007年06期
7 路畅;;基于HMM/SOFMNN混合模型的语音识别[J];科技信息(科学教研);2007年32期
8 杜旭;凌捷;罗雄昌;;基于隐马尔可夫模型的网络入侵检测方法[J];计算机应用与软件;2008年03期
9 程开东;栾方军;马驷良;;一种基于隐马尔可夫模型的在线手写签名认证算法[J];吉林大学学报(理学版);2008年05期
10 王鹏程;;词性标注中隐马尔可夫模型的改进[J];河南财政税务高等专科学校学报;2009年04期
中国重要会议论文全文数据库 前10条
1 ;中国声学学会青年学术会议[CYCA'99]组织机构名单[A];中国声学学会1999年青年学术会议[CYCA'99]论文集[C];1999年
2 ;2005年全国理论计算机科学学术年会组织机构名单[A];2005年全国理论计算机科学学术年会论文集[C];2005年
3 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
4 ;第一届海峡两岸隧道与地下工程学术与技术研讨会会议组织机构名单[A];第一届海峡两岸隧道与地下工程学术与技术研讨会论文集(上册)[C];1999年
5 ;2008年中国高校通信类院系学术研讨会组织机构名单[A];2008年中国高校通信类院系学术研讨会论文集(下册)[C];2009年
6 ;第十届中国科协年会信息化与社会发展学术讨论会分会场组织机构名单[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
7 廖先桃;于海滨;秦兵;刘挺;;HMM与自动规则提取相结合的中文命名实体识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 史树敏;王志强;周浪;冯冲;黄河燕;;基于条件随机域的中文命名实体识别[A];第三届学生计算语言学研讨会论文集[C];2006年
9 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
10 ;2008年中国高校通信类院系学术研讨会组织机构名单[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
中国重要报纸全文数据库 前10条
1 记者 刘朝君;组织机构名址库年内建成[N];中国邮政报;2003年
2 蒋一帆;邮集专有名词与专业术语的英译[N];中国集邮报;2009年
3 裴效华 李文良;太原局贺卡营销全面丰收[N];中国邮政报;2009年
4 记者 王俐君 通讯员 欧志红;湖南名址信息库建设强力启动[N];中国邮政报;2003年
5 记者 郭奇志;新疆积极采集名址信息[N];中国邮政报;2003年
6 本报记者 肖涛;甘洒热血谱华章[N];西藏日报;2010年
7 ;新式报刊订阅单将启用[N];中国邮政报;2002年
8 记者 郭奇志;新疆加强名址信息管理与维护[N];中国邮政报;2003年
9 刘效仁;创新利益分配格局是一剂良方[N];中国审计报;2009年
10 本报记者 白 岭;高价股回落透出什么信息[N];证券日报;2005年
中国博士学位论文全文数据库 前10条
1 李杰;隐马尔可夫模型的研究及其在图像识别中的应用[D];清华大学;2004年
2 刘小军;人脸识别技术研究[D];中国科学院电子学研究所;2001年
3 肖文斌;基于耦合隐马尔可夫模型的滚动轴承故障诊断与性能退化评估研究[D];上海交通大学;2011年
4 陈立伟;基于HMM和ANN的汉语语音识别[D];哈尔滨工程大学;2005年
5 钱琴;指涉理论与俄语中的指涉现象[D];上海外国语大学;2007年
6 周韶园;基于HMM的统计过程监控研究[D];浙江大学;2005年
7 曹刚;运动车辆识别技术研究[D];四川大学;2004年
8 赫泉玲;多元小波的构造、提升及其应用[D];吉林大学;2005年
9 丁明石;基于移动通信技术的远程实时心电监护系统设计[D];天津大学;2005年
10 冯庆堂;地形匹配新方法及其环境适应性研究[D];国防科学技术大学;2004年
中国硕士学位论文全文数据库 前10条
1 乌兰敖日格乐;中文军事组织机构名的识别[D];大连理工大学;2010年
2 任振刚;基于SAPI引擎的语音交互方法的研究与实现[D];沈阳工业大学;2005年
3 刘波;基于隐马尔可夫模型的系统调用异常检测系统[D];兰州大学;2006年
4 余浩;说话人识别的自适应算法研究[D];武汉理工大学;2005年
5 凌广杰;基于分段半马尔可夫模型的在线序列模式检测方法研究[D];浙江大学;2006年
6 纪灵军;隐非齐次马尔可夫模型的混合性[D];江苏大学;2008年
7 张军;基于MFCC的语音识别加速技术研究[D];北京化工大学;2009年
8 朱义鑫;基于网络的隐马尔可夫异常检测技术研究[D];新疆大学;2005年
9 徐欣;基于HMM的中医临床疗效评价分析研究[D];北京交通大学;2009年
10 闫三锋;基于单片机语音识别系统设计[D];西北工业大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026