1. 研究目的与意义(文献综述)
随着21世纪的到来,信息技术正在蓬勃发展,物联网已经融入了每个人的生活之中。几乎每个人都拥有了自己的移动终端,移动终端的应用范围越来越广泛,文字识别(cor)也开始被人重视。文字图像信息是人类获取外界信息的主要来源之一,如何获冲图像中获取信息即文字识别,文字识别技术广泛的应用于生活的多个方面,小于日常的阅读,大至银行业务中费用征收业务的信用卡的自动处理,办公室打字员工作的局部自动化。文字识别可以给我我们的生活提供更加便利的方式,利于提高工作效率。开发基于安卓平台的卡片文字识别软件,可以适应与时代共同发展的潮流,贴近于人们的生活,服务于人们生活。
利用计算机自动识别文字的技术,是模式识别技术的一个重要应用领域。人们在工作和学习中,经常遇到有大量的文字、报表和文本需要处理的情况。使用人工的方法,工作效率低下,而且有满足不了要求的可能性。所以为了提高工作效率和节约人力物力,文字识别就被提上日程。文字识别方法在西方发达国家起步很早,从计算机刚刚出现的时候就开始了,并在很短的时间里就制造出了光学字符识别器;现在英语考试中用来识别答题卡上的 2b 铅笔填涂的答案的机器,在六十年代早期就出现了;在六十年代后期,就有了能够区分出不同字体的文字识别机器,这些机器基本上能满足人们工作的业务需求。功能上满足了实际应用的需要,自然而然就要对机器的性能进行优化。自七十年代开始文字识别技术的主要研究方向开始向着文字识别的理论和文字识别机器的性
能提升转变,对非字母文字识别技术的研究也逐渐增多。
2. 研究的基本内容与方案
基本内容:本系统我们对图像进行缩放操作,缩小图像有利于使手机处理图像的消耗不超出手机内存的限制。将彩色图像转化为灰度图像,再对灰度图像进行自适应二值化处理。自适应二值化处理图像会导致图像中出现大量高斯噪声,用中值滤波可以显著的消除这些噪声。处理后图像边界信息明显,可以轻易的用opencv的边界检测函数检测图像的边缘信息。通过直线检测步骤,从代表边缘的十数条直线中提取出代表卡片边缘的四条直线,再检测直线的交点。再利用交点信息对灰度图像作仿射变换,即可得到由卡片信息充斥了整个画面的图像,也即是用于文字识别的图像。对识别图像直接采用了opencv-2.4.9的ocr文字识别算法,得出最终识别文字。
技术方案:本系统主要的是直线检测、焦点检测、仿射变换、文字识别四个部分。
直线检测模块:经由边缘检测,我们可以得到数条的直线,其中大部分直线代表了卡片边缘。具体来讲,我们分别提取图像上半部分、下半部分、左半部分、右半部分的所有检测到的直线,然后对其作平均,得到的直线基本就是代表卡片边缘的直线。然而这样检测得到的直线往往有一个权衡。
3. 研究计划与安排
第1~周3:查找相关资料;撰写开题报告;数字图像处理,java编程基础知识;
第4~5周:完成相关文献的英译汉翻译,学习android编程基础知识,根据需求设计系统基础架构,确定具体的技术和方案;
第6~9周:根据系统框架确定设计方案和各功能模块的设计,完成软件的直线检测、焦点检测;
4. 参考文献(12篇以上)
[1]konrad adenauer.android structural designguidelines[j].journal of computer and softwareengineering,2012.3(6):69-72.
[2]patel c, patel a, patel d. optical character recognition byopen ocr tool tesseract: a case study[j]. international journal of computerapplications. 2012,55(10): 50-56.
[3]felt a p, chin e; hanna s, et al. android permissionsdemystified[c]. proceedings of the 18th acm conference on computer andcommunications security. acm, 2011:627-638.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。