1. 研究目的与意义、国内外研究现状(文献综述)
菊花是中国具有代表性意义的花卉,同时菊花也是一种极具观赏价值和药用价值的花卉。随着物质生活的丰富,育种专家也培育出种类繁多的菊花,因此快速准确地识别出菊花的品种对于指导人们的生产生活具有十分重要的意义。 20世纪50年代出现的数字图像处理技术在60年代初期便成为一门正式的学科。近20多年来,随着数字图像处理技术的专业化、各种模式识别技术的日趋成熟,数字图像处理技术在农作物识别[1]、害虫检测[2]、种子质量检验、农产品品质检测与分级等方面得到了广泛研究,并且在农业领域显示出巨大的应用潜力。但是菊花品种识别方面的研究成果较少。 随着近几年深度学习[3]的兴起,神经网络技术作为深度学习的核心技术,已经取得了较大的突破。图像分类的准确率成为了新的神经网络模型的性能检验标准。作为图像分类技术研究的热点领域之一的细粒度图像分类(fine-grained image categorization),也被称为细粒度识别、子类别分类,是计算机视觉领域兴起的新的研究热点。细粒度图像分类旨在对大类别比如鸟类[4],进行更加细致的划分。此类任务非常具有挑战性,这是由于子类类别的微小的类间差异和较大的类内差异,相比于普通的图像分类任务,细粒度的图像分类显然难度要大得多。 早期的细粒度图像分类方法都是基于人工设计的特征的分类算法,人工设计特征的表达能力非常有限,因此分类效果并不理想。并且人工特征大多依赖于大量的人工标注信息,耗费资源的同时也限制了该类算法的应用场景。近年来由于深度学习技术的快速发展,特别是卷积神经网络技术的快速进步,使得深度学习特征在细粒度图像分类上应用广泛。基于深度学习得到的特征具有更强的表达能力,因此涌现大量的基于深度特征学习的算法,这极大的促进了该领域的研究进步。深度学习模型具有端到端训练的特点,并且基于深度特征学习的算法日趋不再依赖于人工标注信息,而仅仅使用图像的类别标签,这使得细粒度图像分类技术发展更为迅速,该领域也日趋发展成熟[5]。 例如,常见的细粒度图像分类数据集CUB-200[6]中的两个物种,加州鸥和北极鸥,从竖直方向的对比,两个不同物种长相非常相似,而从对比水平方向可知,同一物种由于姿态,背景以及拍摄角度的不同,存在较大的类内差异。因此,要想顺利的对两个极为相似的物种进行细粒度分类,最重要的是在图像中找到能够区分这两个物种的区分性的区域块(discriminative part),并能够对这些有区分性的区域块的特征进行较好的表示。 由于深度卷积网络能够学习到非常鲁棒的图像特征表示,对图像进行细粒度分类的方法,大多都是以深度卷积网络为基础的,这些方法大致可以分为以下四个方向:基于常规图像分类网络的微调方法[7] 基于细粒度特征学习(fine-grained feature learning)的方法 基于目标块的检测(part detection)和对齐(alignment)的方法 基于视觉注意机制(visualattention)的方法。其中基于细粒度特征学习(fine-grained feature learning)的方法在不使用Bounding Box(边框)标注信息的情况下,在CUB200-2011数据集上到达了84.1%的分类精度;而使用Bounding Box时,其分类精度高达85.1%。Lin等人在2015年发表于ICCV的论文[8]中提出双线性卷积神经网络模型(Bilinear CNN)实现对深度卷积特征更好的表示。该方法使用VGG-D和VGG-M两个网络作为基准网络,实现对细粒度图像的有效识别。 |
双线性CNN模型能够基于简洁的网络模型,一方面,CNN网络能实现对细粒度图像进行高层语义特征获取,通过迭代训练网络模型中的卷积参数,过滤图像中不相关的背景信息。更重要的是另一方面,网络A 和网络B在图像识别任务中扮演着互补的角色,即网络A能够对图像中的物体进行定位,而网络B则是完成对网络A 定位到的物体位置进行特征提取。通过这种方式,两个网络能够配合完成对输入细粒度图像的类检测和目标特征去的过程,较好地完成细粒度图像识别任务。 基于目标块(object part)检测的方法思路是:先在图像中检测出目标所在的位置,然后再检测出目标中有区分性区域的位置,然后将目标图像(即前景)以及具有区分性的目标区域块同时送入深度卷积网络进行分类。但是,基于目标块检测的方法,往往在训练过程中需要用到目标的Bounding box标注信息,甚至是目标图像中的关键特征点信息,而在实际应用中,要想获取到这些标注信息是非常困难的。比较有代表性的是2014年ECCV中提出来的Part-RCNN方法。 视觉注意机制(Vision AttentionMechanism)是人类视觉所特有的信号处理机制。具体表现为视觉系统在看东西的时候,先通过快速扫描全局图像获得需要关注的目标区域,而后抑制其他无用信息以获取感兴趣的目标[9]。目前,基于CNN网络的视觉注意方法被广泛应用到计算机视觉中,包括目标检测、识别等任务。在深度卷积网络中,同样能够利用注意模型来寻找图像中的感兴趣区域或区分性区域,并且对于不同的任务,卷积网络关注的感兴趣区域是不同的。 目前精细分类领域发展出了包括基于多网络学习、目标块和视觉注意等多种方法,每一种方法都是为了获取到图像中具有区分性的区域,从而帮助网络学习到更加有效的特征,用来完成对细粒度图像的分类与识别[10]。特别是通过使用视觉注意机制,能够在不依赖人工标注框信息的情况下,自动学习出图像中细微的区分性区域,达到非常高的分类精度。 |
2. 研究的基本内容和问题
研究目标:
(1)通过卷积神经网络对不同种类菊花图片进行训练得到分类器。
(2)设计的菊花图像检测识别软件可以仅通过图像照片或者是实时的拍摄对菊花的品种进行预测。
3. 研究的方法与方案
研究方法:
(1) 通过python opencv对菊花图像进行预处理,获得数据集。
(2) 通过pil库对菊花图像进行数据增强。
4. 研究创新点
(1) 利用图像增强等预处理技术提高菊花图片质量及数量,从而获得更加优质的数据集,提高分类器的识别精度。
(2) 选用不同的神经网络如:cnn、part r-cnn、bilinear cnn、vgg-16等对菊花数据集进行训练,获得不同的分类器,并对分类器的识别精度进行对比。
(3) 设计菊花识别系统,能够将菊花的识别结果可视化的呈现出来,并能够实时对菊花图片进行识别。
5. 研究计划与进展
(1)2020年1月-2020年2月:
收集与本项目有关的资料,学习有关的研究工作积累和已有的研究工作成绩;并学习python编程语言。学习数字图像处理技术及相关处理算法,并对菊花图片进行预处理。
(2)2020年2月—2020年3月
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。