全文总字数:4078字
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
卷积神经网络(convolutional neural network, cnn)是一种模拟人类大脑的神经网络的前馈神经网络,被广泛应用于大量图像处理中,具有出色的表现。卷积神经网络由一个或多个卷积层、关联权重、池化层(pooling layer)以及全连接层组成。这一结构使得卷积神经网络能够有效地利用和处理输入数据的二维结构。与其他的深度学习结构相比,卷积神经网络在图像处理和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相对于其它前馈、深度神经网络等,卷积神经网络需要考量的参数更少,使之成为一种当下十分热门的深度学习结构之一。
卷积神经网络的前向和反向算法是卷积神经网络中一个基本的算法。卷积神经网络与普通神经网络非常类似,它们都由具有可学习的权重和偏置常量(biases)的神经元组成。每个神经元都接收一些输入,并做一些点积运算,输出是每个分类的概率值,普通神经网络里的一些计算技巧到这里依旧适用。而卷积神经网络与普通神经网络的不同之处在于,卷积神经网络的默认输入是图像,可以让我们把特定的性质编码进入网络结构,使前馈函数更加有效率,并减少了大量参数。卷积神经网络的前向传播算法包括:cnn输入层到卷积层的前向传播、cnn隐藏层到卷积层的前向传播、cnn隐藏层到池化层的前向传播、cnn隐藏层到全连接层的前向传播;卷积神经网络的反向传播包括:池化层到上一隐藏层的反向传播、卷积层到上一隐藏层的反向传播、以及推导隐藏层的w和b梯度。
2. 研究的基本内容与方案
本课题以卷积神经网络中一个经典模型——手写数字识别系统为基础,首先分析卷积神经网络的前向传播过程,分别提取卷积层、池化层等主要计算单元,然后分析卷积神经网络的反向传播过程,并完成了误差传播过程、权重梯度计算过程与前向传播的同构化,最后从并行运算展开维度、资源的可控性、带宽要求、可配置性、资源利用率、釆样运算兼容性几个方面对乘加树结构进行分析,然后研究了卷积神经网络在现场可编程门阵列(Field-Programmable Gate Array, FPGA)上的实现及加速。手写数字识别系统主要依靠的是卷积神经网络中的LeNet模型,一般为软件实现,然而硬件系统具有并行性和速度更快的特点,因此,本课题将用硬件描述语言(Verilog HDL)实现卷积神经网络,在保证识别率不降低的前提下,充分利用硬件的速度快的优点,实现卷积神经网络的加速,给出FPGA加速器的实现方案。本次选取的卷积神经网络是LeNet模型,通过反向传播训练MNIST数据库中60000副手写数字样本图片,提取准确率最高的权重与偏置,然后进行网络的前向传播,完成数字识别。课题的仿真过程借助ModelSim和Quartus II仿真软件实现。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成英文资料的翻译,完成开题报告。
第4-5周:熟悉掌握基本理论,熟悉开发环境。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1] 梁修壮. 基于fpga的卷积神经网络加速器[d]. 学位论文. 2019(4)
[2] 蹇强. 基于fpga的卷积神经网络加速器[d]. 学位论文. 2019
[3] 翟社平,邱程,杨媛媛,等.基于 FPGA 的卷积神经网络加速器设计与实现[j].微电子学与计算机,2019, 36(8): 83 - 86
[4] 李嘉辉, 蔡述庭, 陈学松, et al. 基于fpga的卷积神经网络的实现[j]. 自动化与信息工程, 2018, v.39(01):37-42.
[5] 孙敬成,王正彦,李增刚.卷积神经网络数字识别系统的fpga实现[j/ol].计算机工程与应用: 1-11[2020-03-10].
[6] 秦华标,曹钦平.基于fpga的卷积神经网络硬件加速器设计[j].电子与信息学报,2019,41(11):2599-2605.
[7] 翟社平,邱程,杨媛媛,李婧,江婷婷.基于fpga的卷积神经网络加速器设计与实现[j].微电子学与计算机,2019,36(08):83-86.
[8] zhang c, li p, sun g, et al. optimizing fpga-based accelerator design for deep convolutional neural networks[c] proceedings of the 2015 acm/sigda international symposium on field-programmable gate arrays. acm, 2015: 161-170.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。