1. 研究目的与意义(文献综述)
1、目的及意义
如今,人类可以说是生活在了两个世界中,一个是现实世界,另一个便是由各种电子设备构造出来的虚拟世界,人们从现实世界中获得一些想要分享的信息并传到了虚拟世界中,然后其他人便能共享到这其中的信息。这个过程看似容易,却需要相当多的技术的支持,一是对于现实世界中的信息获取,二是现实信息与虚拟信息即文本信息的转换,三是网络的连通。本课题便是研究以上的第二步过程。
传统的文档图像的检测和识别已趋于成熟,但是自然场景图像的检测和识别中仍然有很大的改进空间。最开始的自然场景图像仅仅是将获得的图像进行标注,这种方式存在很大的弊端,首先它需要大量的人工操作,这就使得信息的传递有了时间的滞后,另外对图像的标注也会因为编辑者的不同而产生歧义,使得信息在传递过程中模糊了原貌。
2. 研究的基本内容与方案
自然场景图像检测的算法一般分为以下几步,产生候选,字符过滤,字符合并成文本行,文本过滤和后处理。其中对于整个步骤最为关键的便是产生候选,现在多数采用的是连通域方案。所谓连通域,便是对图像的色差变化进行分析,从而对整个图像划分为各个不同的区域。
连通域一般需要进行二值化处理,步骤如下:
(1)标记图像左上角,即,第一行第一列的像素。如果其像素值为255,则标记该点的值为1,否则,开始扫描第一行第二列的像素。
3. 研究计划与安排
(1) 第七学期末,确定设计题目。
(2) 第1—4周,根据所选的题目收集相关技术文献资料,完成开题报告,中英文翻译和文献检索工作。
(3) 第5周,安装所需软件,配置好系统,熟悉开发环境,做好前期准备工作。
4. 参考文献(12篇以上)
1. l. neumann and j. matas, “real-time scene text localization and recognition”, cvpr 2012
2. h.i. koo and d.h. kim, “scene text detection via connected component clustering and nontext filtering”, tip 2013.
3. 李鉴鸿,“基于mser的图像文本定位的应用研究”,华南理工大学硕士论文,2015.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。