全文总字数:4423字
1. 研究目的与意义(文献综述)
当前数字化文档逐渐成为主流,现有的文档定位算法至考虑到比较简单的背景下捕捉或者通过传统光学字符扫描仪来完成,对于一些复杂的自然场景的文档定位仍然存在较大的难点。对于图片中的文档信息,由于拍摄角度、光照、成像大小、色彩对比度等存在许多不确定因素,因此多文档定位技术仍存在很大的挑战,针对以上存在的问题,本次毕业设计以在复杂场景中对多文档进行精准定位为目的,实现自然场景的多文档定位系统。
2. 研究的基本内容与方案
基本内容:
近年来,自然场景图片的文档信息提取变得越来越火热,许多实体应用的技术性需求也越来越高,文档定位系统就变得尤为重要。目前文档定位技术有着不同的内因和外因,外因包括环境光线,图片拍摄角度,不同的色彩对比度,文档信息的像素等,内因由文本的变形等因素造成。与传统的对象定位相比,由于存在文字信息可以出现在图片的任意位置、不同的宽高比提取到的信息不同、对于边界不全信息比较难捕捉等问题,所以文档定位会更加复杂且苦难。
在过去几年中,文档定位有了重大的突破,有不少基于通用对象和语义分段的模型都有较高的准确度。并且氛围两个主要方向,一者是基于通用对象的检测器,另一者是基于语义分段的检测器。目前这两种方法都能在单文档或者简单多文档的图片中对文档信息进行比较精准的定位,但是对于一些复杂场景的多文档图片,文档信息定位的准确度仍有很大的偏差。提高多文档定位的准确度是目前技术市场的迫切需要。
3. 研究计划与安排
1月20日-2月27日 学习python语言,图像处理,深度学习等知识
3月1日-3月15日深入学习基于卷积神经网络的自然场景文档定位算法
3月20日-4月30日 收集自然场景下的多文档图片,构建数据集,设计多文档定位的算法,并在数据集上进行测试。
4. 参考文献(12篇以上)
[1] wong k y, casey r g, wahl f m. document analysis system[j]. ibm journal of research and development, 1982, 26(6): 647-656.
[2] nagy g. twenty years of document image analysis in pami[j]. ieee transactions on pattern analysis machine intelligence, 2000 (1): 38-62.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。