收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种基于Google的OCR结果校对新方法

颜建强  高新波  
【摘要】:为了提高OCR识别率,许多校对算法被提出用作后处理.这些方法利用自然语言规律统计大量的语料库进行语法判断.由于语料库规模有限且无法及时更新,导致一些网络新词、专用名词等常被错误处理.为此,文中将传统的语料库和Google知识库相结合,利用Google知识库获得网络新词等出现的频率,建立N-Gram模型,利用词语间的接续关系进行查错,再借助Google的拼写校对功能和词语之间的可信度进行改错.相比传统的方法,该方法的语料库源于互联网,对一些新词有更好的校对效果,更适合图像中嵌入的文字信息识别结果的校正.

知网文化
【相似文献】
中国期刊全文数据库 前13条
1 陆宜新;赵茜;;科技期刊软盘稿的编辑加工与校对[J];中国科技期刊研究;2004年03期
2 陆玉清;洪宇;陆军;姚建民;朱巧明;;基于上下文的真词错误检查及校对方法[J];中文信息学报;2011年01期
3 林晖;林劼;;基于Markov模型的改进型疑错窗口算法[J];实验科学与技术;2008年04期
4 潘昊;颜军;;基于中文分词的文本自动校对算法[J];武汉理工大学学报;2009年03期
5 王为光,王知衍;三维机械模型和其对应工程图纸的智能化校对方法[J];计算机工程;2004年11期
6 苏炳均;;基于语料库的中文自动查错综述[J];中国经贸导刊;2009年13期
7 汪维家,陈笑蓉,秦进,陆汝占;一种基于窗口技术的中文文本自动校对方法[J];贵州大学学报(自然科学版);2003年02期
8 俞敏,张丽辉;微机排版带来的变革[J];科技与出版;1996年05期
9 牛洪梅;加米拉·吾守尔;吐尔根·依布拉音;;现代维吾尔语的词性标注校对技术研究[J];伊犁师范学院学报(自然科学版);2007年01期
10 顾德南;论文摘数据库数据加工质量保障体系[J];冶金信息导刊;2002年05期
11 张建芬,邓晓群,沈志超;利用方正文易和Acrobat软件实现期刊论文校对[J];编辑学报;2004年03期
12 解凯,郭恒业,张田文;一种具有径向畸变校正的图像整合算法[J];电子学报;2004年10期
13 杜飞龙;自动校对渐入佳境[J];微电脑世界;2001年07期
中国重要会议论文全文数据库 前3条
1 陆玉清;洪宇;陆军;姚建民;朱巧明;;基于上下文的真词错误检查及校对方法[A];第六届全国信息检索学术会议论文集[C];2010年
2 赵军;敖其尔;吉仁尼格;巩政;葡萄;陈建东;;基于统计语言模型蒙古文词汇分析校正器的设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
3 曲维光;;语料自动校对中一致性问题的处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
中国硕士学位论文全文数据库 前1条
1 郇政永;基于OCR的中文文本校对研究[D];北方工业大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978