收藏本站
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

一种新的文本预处理方法研究

郑苏民  张松顺  
【摘要】:文本预处理是整个字符识别系统的重要组成部分.它的性能的优劣,对整个字符识别系统的识别率和识别速度至关重要.由于汉字印刷文稿版面的复杂性,其文本预处理远比西文困难.本文提出了一种新的文本预处理方法.实现了含有文字字符,图形,图片和表格的、版面结构复杂的数字图象的分割.整个算法分为两个阶段完成:首先,从图形的连通原则出发,定义了扩展连通域的概念,对整个文本图象逐行扫描,搜索出所有的扩展连通域,进而通过集合的交、并操作,将属于一个字符或图象、图片和表格的若干个扩展连通域合并.这时扩展连通域已标记文本图象中的字符尺寸大小和位置.然后,基于同一行字符的间距的知识,将扩展连通域合并为逻辑字符行(横,竖);

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 ;数据通信讲座(之一)——第一章 基本通信理论[J];计算机工程与应用;1983年07期
2 王玉,张炘中,苏东庄;基于版面分析的文本管理系统[J];中文信息学报;1989年04期
3 赵树贤;界面三角网模型[J];辽宁工程技术大学学报;1992年04期
4 谭建荣;一个连通域的重建算法[J];工程图学学报;1993年02期
5 郑苏民,张松顺;一种新的文本预处理方法研究[J];云南大学学报(自然科学版);1995年01期
6 高玮,吴中奇,童红卫;工程图轮廓线自动识别的新方法[J];计算机应用与软件;1996年06期
7 高静波,唐龙,刘文印,唐泽圣;工程图标注字符的提取与识别[J];计算机学报;1997年07期
8 戴君;机械图纸的信息理解[J];广东自动化与信息工程;1998年01期
9 宋焕生,吴成柯;无窗口的非线性图像滤波器[J];通信学报;1999年S1期
10 李凌;网页的程序设计方法[J];电脑学习;1999年04期
中国重要会议论文全文数据库 前10条
1 王成红;韩兵欣;郑应平;;连续非线性系统游荡不存在条件[A];1998年中国控制会议论文集[C];1998年
2 朱军民;黄磊;刘昌平;;一种分级的电路板图像中的文本定位方法[A];第八届全国汉字识别学术会议论文集[C];2002年
3 黄磊;刘昌平;;信封图像的快速倾斜矫正算法[A];第八届全国汉字识别学术会议论文集[C];2002年
4 宋江洪;赵忠明;迟耀斌;;一种基于区域填充的孤立区域的去除算法[A];图像 仿真 信息技术——第二届联合学术会议论文集[C];2002年
5 赵红军;;智能监控中非防护异常的检测[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
6 王晶;张艳宁;;针对高分辨率遥感影像分割的改进连通域标记方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
7 郭浩;刘朝斌;;利用方向场结构确定指纹的参考基准点[A];第三届全国信息获取与处理学术会议论文集[C];2005年
8 周鹏;杨向波;朱虹;季瑞瑞;;基于图像检测技术的三极管计数算法[A];第十一届中国体视学与图像分析学术会议论文集[C];2006年
9 张峰;申功勋;;一种适用于天文导航的快速图像分割算法[A];中国航空学会控制与应用第十二届学术年会论文集[C];2006年
10 苏添发;戴曙光;穆平安;;车牌及其字符分割的方法研究[A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集(下册)[C];2006年
中国硕士学位论文全文数据库 前10条
1 张玉庆;智能交通系统中车牌定位问题的研究[D];哈尔滨工程大学;2004年
2 杨其宇;图象处理技术在足球机器人中的应用研究[D];华中科技大学;2004年
3 夏谦;海底热液喷口图像增强与分割算法研究[D];华中科技大学;2005年
4 李艳霞;受限表格识别系统的研究[D];中国科学院研究生院(计算技术研究所);2006年
5 王众;边缘提取算法在景象匹配中的应用研究[D];哈尔滨工程大学;2006年
6 季丽琴;彩色图像内文字的自动提取与去除的研究[D];苏州大学;2006年
7 魏宏喜;印刷体蒙古文字识别中关键技术的研究[D];内蒙古大学;2006年
8 叶飞;基于整体特征的数字字符识别在自动车牌识别系统的研究与应用[D];山东大学;2006年
9 万忠;轨道衡车牌识别系统[D];安徽大学;2006年
10 于深洋;自然环境下的车牌定位与字符分割方法的研究[D];哈尔滨工业大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978