收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于Faster-RCNN的水书古籍手写文字的检测与识别

汤敏丽  谢少敏  刘向荣  
【摘要】:中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110 610个带标签的字符样本.将Faster-RCNN(faster-region based convolutional neural network)算法应用到水书古籍文字识别研究上,以不同组合的数据集作为输入进行实验,在全部80个目标类别上获得了91.95%的平均识别率,实现了页面级的端到端的水书古籍文字的准确定位与识别.实验结果表明,Faster-RCNN模型在目前的数据集上能很好地实现水书手写文字的检测与识别,文中采用的数据扩增方式能明显提升水书手写文字的识别率,为水书文化的保护和传承提供了新思路,对于解决实际应用场景中的水书文字识别问题具有重要意义.

知网文化
【相似文献】
中国期刊全文数据库 前16条
1 闫璟哲;;课程学习方法中文字识别算法研究[J];福建电脑;2020年04期
2 浦世亮;程战战;;基于注意力矫正的自然场景文字识别[J];中国公共安全;2017年09期
3 徐富勇;;基于注意力增强网络的场景文字识别[J];现代计算机;2020年09期
4 李进豪;;文字识别技术在智慧教育中的应用与思考[J];现代计算机;2021年32期
5 付飞飞;;场景文字识别算法的研究[J];福建电脑;2020年04期
6 张华萍;黄辰;;文字识别技术研究[J];物联网技术;2018年08期
7 盛寁;刘伟;;计算机文字识别的发展及应用[J];科技信息;2008年31期
8 柳玉辉;计算机文字识别的技术探讨与应用前景分析[J];软件工程师;1999年04期
9 郭军,马跃,盛立东,钟义信;发展中的文字识别理论与技术[J];电子学报;1995年10期
10 弓耀辉;;图像文字识别中的预处理技术研究综述[J];信息通信;2017年09期
11 张开;岑翠;李林献;谢雨非;;基于蚁群算法的文字识别[J];信息与电脑(理论版);2019年22期
12 孙承鉴,张大华;手写文字识别技术及其在图书馆的应用[J];现代图书情报技术;1993年01期
13 倪光南,丁家福,高仲操,刘金铎;一台手写文字识别机[J];计算机学报;1980年02期
14 张焱;郭梦琰;王峰;邱雄;贺桢;蔡立志;张娟;;基于循环卷积神经网络的模块化文字识别[J];智能计算机与应用;2020年10期
15 丁琼;;水书文字识别系统研究与实现[J];中国新通信;2020年19期
16 张涛;;一种序列文字识别方法[J];工业控制计算机;2018年05期
中国重要会议论文全文数据库 前15条
1 ;中文信息处理发展报告(2016) 第十七章 文字识别研究进展、现状及趋势[A];中文信息处理发展报告(2016)[C];2016年
2 胡瓯静;;标准数字化的初探[A];标准化助力供给侧结构性改革与创新——第十三届中国标准化论坛论文集[C];2016年
3 孙俊;黄开竹;于浩;岩见田均;;面向中国市场的文字识别技术研发[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 王景中;霍超;;基于OCR技术的盲用阅读器设计[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
5 张岩;;中华民族文字识别统一平台(TH-OCR~)系列研究成果及应用[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
6 玉素甫.艾白都拉;潘伟民;热孜万;;笔式维吾尔文识别的中的文字切分研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 费文东;孟相如;;基于细胞神经网络文字识别的特征提取技术[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
8 吴彩荣;龙波;雷江东;罗艳;;浅谈窗口行业业务资料数据库建设及查询应用的实现[A];广西计算机学会2014年学术年会论文集[C];2014年
9 易剑;彭宇新;肖建国;;一种图片文字分割的方法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
10 成纪俊;王富力;成秀凤;;土壤检测标准信息检索系统研制[A];第三届长三角科技论坛(测绘分论坛)暨'2006江苏省测绘学术年会论文集[C];2006年
11 邓聪;傅少荣;高嘉锜;潘嘉辉;;基于不完备数据集近邻聚类的缺失用电信息填补算法[A];福建省电机工程学会2020年学术年会获奖论文集(下册)[C];2021年
12 卢功林;葛俏;王玉娟;谈世磊;曹红伟;卢志鹏;;基于深度学习的不停车自动超载检测方法[A];2020中国自动化大会(CAC2020)论文集[C];2020年
13 王羽;姜晓夏;陆辰;王振宇;王珩;吴振锋;;军事机器阅读理解数据集构建与评估[A];2019第七届中国指挥控制大会论文集[C];2019年
14 缪国宇;刘洪鹏;苏文学;刘荣生;赵相东;;基于数据仓库的企业指标分析系统[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
15 徐蔚然;张洪刚;郭军;;基于语法、语义信息的银行票据二值化算法的构造[A];2001年中国智能自动化会议论文集(下册)[C];2001年
中国博士学位论文全文数据库 前16条
1 姚超;降维算法和手写文字识别中若干问题研究[D];西安电子科技大学;2014年
2 甘吉;手写文字识别及相关问题算法研究[D];中国科学院大学(中国科学院计算机科学与技术学院);2021年
3 许亚美;手写维吾尔文字识别若干关键技术研究[D];西安电子科技大学;2014年
4 冯新杰;面向自然场景汉字识别的非平衡性与抗攻击性研究[D];哈尔滨工业大学;2020年
5 姚聪;自然图像中文字检测与识别研究[D];华中科技大学;2014年
6 仁青东主;基于深度学习的藏文古籍木刻本文字识别研究[D];西藏大学;2021年
7 刘禹良;基于深度学习的自然场景文本检测及端到端识别的研究[D];华南理工大学;2020年
8 叶齐祥;图像和视频文字检测技术研究[D];中国科学院研究生院(计算技术研究所);2006年
9 程艳芬;离线阿拉伯手写体光学文字识别方法的研究[D];武汉理工大学;2009年
10 陈光;特定领域OCR系统的精度与速度问题研究[D];北京邮电大学;2007年
11 玛依热·依布拉音;联机手写维吾尔文字母与单词识别研究[D];武汉大学;2013年
12 马飞;复杂场景下的行人重识别关键技术研究[D];武汉大学;2019年
13 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年
14 王建培;聚类有效性分析及其在电学层析成像中的应用[D];天津大学;2017年
15 杨勋;跨视域行人再识别若干问题研究[D];合肥工业大学;2017年
16 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
中国硕士学位论文全文数据库 前20条
1 丁宇;基于深度学习的自然场景文字识别研究[D];山东科技大学;2020年
2 闫璟哲;课程学习在场景文字识别任务中的应用研究[D];河南大学;2020年
3 陈乙麟;场景文字识别系统的设计与实现[D];北京邮电大学;2020年
4 杨海林;基于深度学习的古籍文字识别和检测[D];华南理工大学;2019年
5 李小璐;基于优化分割与提取的西夏古籍文字识别研究[D];宁夏大学;2019年
6 杨宏志;基于深度学习的自然场景文字识别[D];重庆邮电大学;2019年
7 游京翰;基于深度学习的文字序列识别系统[D];哈尔滨工业大学;2018年
8 刘兴长;基于改进模糊支持向量机的西夏文字识别研究[D];兰州交通大学;2019年
9 闫昆鹏;基于BiRNN的学生手写文字识别系统设计与实现[D];北京工业大学;2019年
10 陈玉新;基于深度学习的场景文字识别研究[D];内蒙古大学;2019年
11 李科;基于深度学习的路牌文字识别算法的研究与实现[D];湖南大学;2018年
12 高威威;基于深度学习的自然场景文字识别[D];安徽大学;2019年
13 赵星驰;基于深度学习的视频文字检测技术[D];北京邮电大学;2019年
14 张博;基于深度置信网络的图像识别算法研究[D];哈尔滨理工大学;2019年
15 邵文良;基于深度学习的医疗单据图文识别关键技术研究与实现[D];北京邮电大学;2019年
16 邹瑞杰;基于深度学习的自然英文文字识别的研究[D];电子科技大学;2019年
17 李其苏;场景物体与场景文本识别关键技术研究[D];南京大学;2016年
18 华绍君;基于图模型匹配的印章文字识别研究[D];湖南大学;2018年
19 冯玮;应用预处理技术的深度学习特征融合的文字识别算法[D];曲阜师范大学;2018年
20 赵航;基于深度学习的低质量文字识别研究[D];华中科技大学;2017年
中国重要报纸全文数据库 前6条
1 ;我国文字识别技术进入应用新阶段[N];人民邮电;2004年
2 ;在线巧识别 工作好轻松[N];电脑报;2004年
3 周娜;天下之大 唯有识也[N];中国科学报;2013年
4 本报记者 顾雪林;梦想:让计算机具有人类的感知能力[N];中国教育报;2002年
5 金水高 刘丽华 陶庄;基本数据集标准新进展[N];计算机世界;2006年
6 本报记者 刘霞;AI助力抗“疫” 美发布新冠病毒数据集[N];科技日报;2020年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978