收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

非规范化中文地址的行政区划提取算法

李晓林  黄爽  卢涛  李霖  
【摘要】:由于互联网上中文地址的非规范化表达,导致互联网中的中文地址信息在地理位置服务中难以直接应用。针对此问题,提出一种非规范中文地址的行政区划提取算法。首先,对原始数据进行"路"特征词分组预处理;再利用行政区划字典和移动窗口最大匹配算法,从中文地址中提取所有可能的行政区划数据集;然后,利用中文地址行政区划元素之间具有层次关系的特点,建立行政区划条件集合运算规则,对获取的数据集进行集合运算;再利用行政区划匹配度建立一种行政区划集合解析规则,来计算行政区划可信度;最后,得到可信度最大信息量最完整的中文地址的行政区划。利用从互联网中提取的约25万条中文地址数据进行是否采用"路"特征词分组处理以及是否进行可信度计算处理,对算法的可用性进行了验证,并与目前的地址匹配技术进行对比,准确率达到93.51%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 真鸣;中文信息研究会少数民族专委会成立大会简况[J];计算机学报;1986年01期
2 ;《中文信息学报》第二届编委会第一次会议纪要[J];中文信息学报;1991年02期
3 曹来发;;中文电脑交流会、中文信息全国学术交流会在蓉召开[J];水利电力机械;1991年05期
4 ;中国首创新期刊 八载享誉海内外 《中文信息》[J];自然杂志;1993年Z1期
5 刘泽先;中文信息的发展方向[J];中文信息;1994年05期
6 ;云南中文信息界筹建中文信息学会分会[J];中文信息;1994年05期
7 王缉志;关于Internet开发的一项建议[J];电子出版;1998年05期
8 雷润玲;;“北极星”:帮你寻找网上中文信息[J];当代图书馆;1998年02期
9 晓月;;《RichWin for Windows 2000》[J];电脑采购周刊;2000年29期
10 尤昉,李涓子,王作英;基于《知网》的中文信息结构抽取研究[J];计算机工程与应用;2002年18期
11 吴克忠;;中文信息技术的创新与发展(下)[J];办公自动化;2003年07期
12 ;书讯[J];中文信息学报;2009年04期
13 ;《中文信息学报》征稿简则[J];中文信息学报;2011年02期
14 ;《中文信息学报》征稿简则[J];中文信息学报;2011年06期
15 ;《中文信息学报》征稿简则[J];中文信息学报;2012年01期
16 ;《中文信息学报》征稿简则[J];中文信息学报;2013年04期
17 陈树楷 ,姜德存;中国中文信息研究会1982年活动综述[J];计算机研究与发展;1983年05期
18 ;《中文信息》已于十月创刊[J];微计算机应用;1984年04期
19 阎久佐;;我校首创“计算机中文信息库”[J];北京师范大学学报(自然科学版);1985年04期
20 本刊编辑部;纪念《中文信息学报》创刊五周年[J];中文信息学报;1991年04期
中国重要会议论文全文数据库 前7条
1 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年
2 陈晓鸥;;从中文电子出版到中文电子传播[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 王春元;张韬;;一种获取网页主要中文信息的方法[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
5 ;中文信息的智能处理[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
6 宋彦;黄昌宁;揭春雨;;中文CCG树库的构建[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 陈儒;张宇;刘挺;;面向网络实时数据流的中文信息多模式模糊匹配[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
中国博士学位论文全文数据库 前5条
1 胡明;Web中文信息智能获取与分类研究[D];吉林大学;2005年
2 丁凯;基于增量学习的中文手写书写者自适应技术研究[D];华南理工大学;2011年
3 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
4 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
5 张紫琼;在线中文评论情感分类问题研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 王倩;电子商务中的中文评论挖掘技术及应用的研究[D];西南交通大学;2015年
2 高源;中文事件抽取关键技术研究[D];解放军信息工程大学;2015年
3 龙耀发;中文时态关键词识别问题研究[D];广东工业大学;2016年
4 裴蕴艺;中文旅游评论的情感分析研究[D];北京交通大学;2016年
5 黄学华;基于双语的中文零指代研究[D];苏州大学;2016年
6 刘盼盼;中文新闻主题事件的关联性识别研究[D];昆明理工大学;2016年
7 齐祥祥;多标记中文问句分类研究多标记中文问句[D];昆明理工大学;2016年
8 苗惠君;中文评论短文本的评价对象抽取研究[D];合肥工业大学;2016年
9 黄李伟;中文零指代消解研究[D];苏州大学;2010年
10 高俊伟;中文指代消解关键问题研究[D];苏州大学;2012年
中国重要报纸全文数据库 前10条
1 本报记者 陈方;中文信息 期待精品[N];光明日报;2000年
2 凌飞;抵制网络经济时代的话语霸权[N];社会科学报;2000年
3 本报驻美国特约记者 王云 驻法国特约记者 苑大喜;欧美博物馆力推中文服务[N];中国文化报;2013年
4 肖薇;中文之星重组亮出杀手锏[N];中国证券报;2000年
5 陈金岭;中文短消息让手机和呼机合二为一[N];光明日报;2000年
6 侯雪林;自主创新 迎接拼字文明时代到来[N];大众科技报;2007年
7 安徽 张来东;在JAVA开发中的中文处理问题及解决办法[N];中国计算机报;2001年
8 记者李行;海峡两岸共商中文信息技术合作大计[N];新疆日报(汉);2009年
9 罗敏;《中国C网中文信息应用网络系统》近日通过技术成果鉴定[N];中国高新技术产业导报;2001年
10 晓 飞;选购手机的小诀窍[N];大众科技报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978