基于全卷积神经网络的文档图像二值化算法研究开题报告

 2021-12-16 21:46:46

全文总字数:4350字

1. 研究目的与意义(文献综述)

文档作为信息的一种载体,在现今社会生活中占据着异常重要的地位。通常,人们把存储在计算机或者纸上一切具有阅读意义的信息称为文档。从文字信息的记录上看,一方面传统方式记录的文字通常记录和保存在纸质媒介上,但随着信息技术的飞速发展,人们已经进入了信息大爆炸的大数据时代,传统的文档存储方式已经没有办法满足人们海量数据的存储需求,数据--尤其是文字信--其存储方式从纸质文件向电子文档进行过度;另一方面,经年累月的积攒,仍旧被保存在纸质文件上的文字信息数量极大,且即使是电子文档盛行的今天,我们也无法完全放弃纸质文档的使用,同样也没有办法完全凭借人力完成将如此多传统文档上的文字信息转化为文本数据录入到电子存储设备之中。

排除人工录入的方式,不外乎以计算机程序处理图像形式录入的传统媒介文档,识别录入图像中的文字信息,并转换为字符数据保存在电子存储设备上。换言之就是用电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,即光学字符识别(optical character recognition,ocr)技术。

整个ocr识别过程包括图像输入、二值化、噪声去除、倾斜矫正、版面分析字符切割、字符识别等过程。这种技术需要考虑纸质文件在存放过程中受物理条件的影响容易出现纸张破损、墨水污渍、背景渗透或因人为破坏产生污迹等现象,还要处理拍摄文档图像时,容易出现光照不均匀的问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

本毕业设计的基于全卷积神经网络的文档图像二值化思想下,将传统的文档二值化看作一个图像分割问题,利用图像分割领域中典型的神经网络模型分割文档图像,把前景和背景的确定视作一个二分类的图像分割过程。让现有或改进的全卷积神经网络,在文档二值化研究中典型的数据集上进行训练,学习文档图像的前景和背景特点,得到合理的文档二值化网络及其权重,然后让这个网络进行文档图像二值化处理,观察实验结果,并进行适当地优化。

具体目标是通过现有或者改进的全卷积神经网络,可以从存在破损、模糊等不利因素影响的文档图像中分割前景。

拟采用的技术语言为python3.7,一种动态的、面向对象的脚本语言,在科学计算和图形处理等领域有广泛的应用,众多开源的科学计算软件包都提供了python的调用接口,例如著名的计算机视觉库opencv、三维可视化库vtk、医学图像处理库itk,其本身也有numpy、scipy和matplotli等十分经典的科学计算扩展库。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1) 2020年2月24日——2019年3月2日,查阅资料,整理开题报告。

(2) 2020年3月3日——2019年3月15日,搭建云服务器上的神经网络实验环境,查阅现有的图像分割神经网络代码和实现过程构建初步的,可以运行的神经网络,熟悉神经网络开发和运行。

(3) 2020年3月16日——2019年3月22日,调整现有神经网络是输出格式为二分类,使其符合文档二值化的处理逻辑。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 周志华. 机器学习. 清华大学出版社,2016

[2] i. pratikakis, k. zagoris, g.barlas and b. gatos, “icdar2017 competition on document image binarization(dibco 2017)”, 14th iapr international conference on document analysis andrecognition, july. 03, 2017.

[3] g. chutani, t. patnaik and v.dwivedi , “an improved approach for automatic denoising and binarization ofdegraded document images based on region localization”, 2015 internationalconference on advances in computing, communications and informatics (icacci)

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。