全文总字数:1711字
1. 研究目的与意义
在典型的光学字符识别过程中,预处理作为不可或缺的步骤,着重于对图像进行增强和补偿处理以简化特征的提取过程。然而,对纸质文档扫描或拍照时不可避免的会产生图像倾斜的现象,为了保证光学字符识别技术识别的准确度,对文档图像进行倾斜校正是非常有必要的。Hough变换作为当前应用比较广泛的倾斜校正方法,可以直接检测出图像中的最长直线,并计算倾斜角度,其抗干扰能力比较强,但是计算量过大,程序执行慢,执行效率不高。Hough变换法进行倾角检测的最大精度为1度。它的优点是可以计算有断点的直线的倾角。最小二乘法的优点就是运算量小,但是其抗干扰能力比较差,容易受到噪声的影响。两点法虽然理论简单,但由于采样点比较多而且这些点服从随机分布,计算均值后能有效抑制干扰。针对传统文档图像倾斜校正算法对文档图像中存在图片区与干扰时校正精度低的问题,提出了一种Radon变换的改进算法。更多还原
2. 国内外研究现状分析
目前,国内外学者就文本图像倾斜校正进行了大量的研究,运用多种方法实现了文本图像倾斜校正。例如基于hough变换、基于投影、pca算法、相连分量聚类法、基于交叉相关性法、基于fourier变换的方法、线性回归法、两点等等。这几种方法均有不足之处,导致文本图像倾斜校正准备率不高或者效率不高。例如投影特征法,因直接在原始图像上运算,计算量非常大,且当图像含有较多噪音时,其计算准确率降低。因此找到一种高效且普遍适用的字符倾斜校正算法显得十分重要。
1917年,奥地利数学家johamn rodon 提出了一种积分变换radon变换。两维情况下radon变换大致可以这样理解:一个平面内沿不同的直线(直线与原点的距离为d,方向角为α)对f(x,y)做线积分,得到的像f(d,α)就是函数f的radon变换。也就是说,平面(d,α)的每个点的像函数值对应了原始函数的某个线积分值。一个更直观的理解是,假设你的手指被一个很强的平行光源透射,你迎着光源看到的手指图像就是手指的光衰减系数的三维radon变换在给定方向的值。一个最简单而直接的应用就是拿来检测图像里面含有的直线成分,很显然地,任何直线都会导致radon像在该直线对应(d,α)处的极值。
目前国内外关于radon变换的文本图像倾斜校正方式有许多种,它们从本质上来说是一样的,都是最后根据radon变换的得到的积分值来确定倾斜角度,进而旋转校正。不同的地方在它们提取图像边缘这一步,采用的边缘检测算子不一样,所以得到的倾斜角度也不完全相同。常用边缘检测算子包括prewitt算子、sobel算子、roberts算子、canny算子和laplace算子。
3. 研究的基本内容与计划
文本图像的倾斜校正可分为倾角切割、旋转校正两个问题,重点在于倾斜角的检测。本文提出一种基于radon变换应用于一般倾斜字符校正的方法。该方法主要借鉴相连分量的思想,对文本图像做一系列形态学处理,使同行文字膨胀成近似四边形的整体,提取其边框。然后针对边框构成的直线进行radon变换,求出文本中字符倾斜的角度,从而减少校正的误差。
课题的工作安排:
1-3周,收集资料,查阅相关的参考文献完成开题报告。
4. 研究创新点
传统的字符倾斜校正算法均存在不足,基于Radon变换的算法简单有效。该算法分为两个步骤:第一步,重复对二值图像进行数学形态学处理,提取边框。第二步,针对边框构成的直线进行Radon变换,求出倾斜角度。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。