基于深度学习的手写数字识别程序设计开题报告

 2021-08-14 02:14:18

1. 研究目的与意义(文献综述)

随着信息技术的飞速发展,对于生活中常出现的手写数字,人们已不再满足于用人工方法进行识别。数字识别的前景十分广阔,被广泛应用于表格中数字的识别、汽车牌照的数字自动识别和成绩单的识别等多个项目,涉及多个领域。可以说,实现数字的自动识别会给人们提供很大方便。在这些应用中通常的方法是把待识别的数字区域从原始的图像中提取出来,然后把其中的数字串分割成单个字符,再用分类器进行识别。

在手写体数字识别的研究中,对于已二值化的图像,抽取特征的方法有许多种,常用的统计特征有gabor变换特征、legendre矩特征、pseudo-zernike矩特征、zernike矩特征等。统计特征通常反应图像的点阵总体分布情况,这些特征的图像预处理简单,对噪声不敏感,但对字的一些精细结构部分反应不灵敏。而由数字图像的骨架和轮廓可抽取出手写体数字的结构特征,它往往对于结构的细节部分反应灵敏,但图像预处理复杂,对噪声较为敏感,这导致一个完善的基于结构特征的分类器往往十分庞杂。在识别手写体数字时,常用的分类器有最近邻分类器以及多分类器组合方法。一般认为,不同性质的特征往往反映物体的不同方面,在一种特征空间很难区分的两种模式可能在另一种特征空间很容易分开;而对于同一种特征,不同的分类器又能将该特征以不同的方式映射到决策空间,因此组合使用不同性质的特征和不同的分类器能更为全面地表示一个物体与其他物体的关系,从而得到较好的分类结果。但这样做的缺点是算法复杂,实现繁琐。

深度学习是机器学习中表征学习方法的一类。一个观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更加容易地从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处之一是使用非监督或半监督的特征学习和分层特征提取的高效算法来替代手工获取特征,在极大减少工作量的同时,避免了由设计者自身认知偏差导致的各种问题,特征只由网络结构和输入数据决定,更为客观,具有普遍性。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

这次手写数字识别系统设计基本包含了以下的内容:手写数字数据的获取,图像的自动预处理,图像的分类与输出。手写数字数据的获取较为容易,除了常用的mnist数据集,还可以采集生活中常见的样本;图像的自动预处理由深度学习方法实现,主要作用是将输入图像处理成能够直接被分类器使用的格式;图像的分类与输出则用卷积神经网络实现。后两部分在实际的系统中会形成一个端到端的整体,但由于目前神经网络仍然无法处理大小不同的输入图像,从概念上来讲两者有明显的区别,故在设计中将其分开。

这次设计中的研究目标是实现手写数字的高精度识别,总结并完善实验过程,其中我想完成的工作如下:

1、尝试通过各种方式获得数据。尽管目前常用的数据集如mnist等已经能基本满足训练的需求,但为了让整个系统具有更强的识别能力,应避免仅使用单一数据集,以防出现过度拟合的问题。

3. 研究计划与安排

第1-3周:查阅手写数字识别的相关文献资料,明确研究内容,了解研究所需的相关知识,完成不少于2万字符的英文翻译。确定方案,完成开题报告;

第4-8周:学习几种深度学习方法,比较各种模型之间的优缺点,并评测其可行度,逐步实施设计方案,完成程序的设计;

第9-10周:对设计的方法进行实验,根据实验结果改进程序的设计;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] lecun, yann, yoshua bengio andgeoffrey hinton. "deep learning." nature 521, no. 7553 (2015):436-444.

[2]borji, a.and l. itti. "state-of-the-art in visual attention modeling." ieeetransactions on pattern analysis and machine intelligence 35, no. 1 (2013):185-207.

[3] mnih, v., heess, n., graves,a. (2014). recurrent models of visual attention. in advances in neuralinformation processing systems (pp. 2204-2212).

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。