基于深度学习的动物图像检索的研究和实现开题报告

 2021-12-15 21:28:02

1. 研究目的与意义(文献综述)

1、课题的研究背景和意义

图像随着电子信息技术、计算机技术、通信技术以及互联网的快速进步,逐渐成为重要的信息资源之一。由于一幅图像所能表达的内容要比文字描述要更加充分和丰富。因此,怎样提高图像检索系统的检索时间以及检索的准确率已成为目前研究的热点之一。二十世纪九十年代,基于文本的图像检索技术所存在的问题随着大规模数据库和互联网的不断进步而日益严重。因此,一种新的图像检索技术——基于内容的图像检索(content-based image retrieval,简称 cbir)吸引了研究人员的目光,相关领域的专家学者也把这一方法当作图像检索技术的主流作进一步的研究。与基于文本的图像检索技术需要对图像加注文字信息不同的是,这种新的技术是通过计算机对图像的可视特征,即颜色、纹理、形状以及相互关系等特征进行自动提取,在特征空间内对用户输入的检索图像与数据库中图像进行相似匹配,检索并返回与输入类似的图像。基于图像内容特征的图像检索系统关键的技术是有效图像特征的获取和相似度匹配策略。在过去,基于内容的图像检索系统主要使用低级的可视化特征,无法得到满意的检索结果,所以尽管在基于内容的图像检索上花费了很大的努力,但是基于内容的图像检索依旧是计算机视觉领域中的一个挑战。在基于内容的图像检索系统中,存在的最大的问题是“语义鸿沟”,即机器从低级的可视化特征得到的相似性和人从高级的语义特征得到的相似性之间的不同。传统的基于内容的图像检索系统,只是在低级的可视化特征上学习图像的特征,无法有效的解决“语义鸿沟”,使得 cbir 不能真正意义上支持图像的语义查询,所以基于图像的低级的可视化特征的检索算法仍然是目前研究得较多也比较成熟的。近年来专家们对神经网络的不断研究,hinton提出了深度神经网络即深度学习。深度学习通过组合低级的特征形成更加抽象的高层表示属性类别或者特征,以发现数据的分布规律,这是其他任何算法无法替代的。受深度学习在计算机视觉、语音识别、自然语言处理、图像与视频分析、多媒体等诸多领域取得巨大成功的启发,将深度学习技术用于基于内容特征的图像检索,以解决基于内容特征的图像检索系统中的“语义鸿沟”问题。希望通过深度学习算法直接对图片进行处理,以期减少人类对图像特征提取的干预以及提高图像特征提取的完整性和准确率,进而提升图片检索系统的效率。

我国地域辽阔,具有多种自然环境和气候条件,野生动物资源丰富,约有6300种。根据中国生物多样性公约保护计划的数据,我国的哺乳类动物有607种、鸟类1294种、爬行类动物412种、两栖类动物295种、鱼类约3400种,分别占世界同类动物种类的12.5%、13.26%、6.5%、7.0%、12.1%,其中,有69种鸟类、26种爬行类动物、30种两栖类动物、440种鱼类为我国特有物种,可以说我国是世界生物物种最丰富的国家之一。对于动物学专家而言他们可以通过自身的专业知识来确定动物的种类,而非专业人员了解的野生动物相关知识较少,无法辨别野生动物的确切种类。因此,如何高效、准确地对动物进行识别,是目前野生动物保护的一个亟待解决的问题。通过对已有保护动物图片库建立索引,对于查获的野生动物,则可以采用图像检索的方法对这些动物进行快速鉴别,提高工作人员的办事效率,同时,也可以避免了由于工作人员知识的有限,导致不法分子逃脱法律制裁的情况。从海量的保护动物图像数据中检索出所需的信息进而及时识别保护动物将会成为打击贩卖保护动物的一把利器。然而目前,对保护动物的图像检索研究较少。主要是因为常采用的图像语义不能很好地描述图像中的动物信息内容,如图像的颜色、纹理和布局等语义。因此,本课题对基于内容的动物图像检索关键技术研究,具有重大的实际应用意义。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

基于文本的图像检索这一传统方法已经无法达到用户的要求。目前,基于内容的图像检索得到了迅猛的发展。为了更好地保护动物资源,动物图像的检索是一项具有较好经济价值和社会价值的工作。本文介绍了基于内容图像检索的国内外现状和核心技术,并以此为基础研究并实现了动物图像检索系统。在实际中,直接应用基于内容的图像检索系统,提取的全局特征维数高,不但检索效率较低,速度较慢,而且检索的精度也无法保证。因此,需要根据动物图像的特点,对系统做一些改进。本文主要以cbir为基础,以卷积神经网络为核心来提取图像的特征,研究适合动物图像检索的方法。首先把深度学习中的卷积神经网络模型运用到动物检索系统中,结合动物自身特征采用了改进的vgg-16模型对动物图像进行特征提取,通过卷积神经网络可视化使改进后的vgg-16能提取到更为详细、丰富的动物图像特征;通过对比选择在高维的特征向量中有着更好效果的哈希检索方法,将pca算法结合三种经典的哈希算法进行不同编码长度的实验,通过实验选择了vgg-16后,对其进行降维至合适的图像特征维度,并选择了256bit局部敏感哈希算法作为检索方法;再根据选择好的模型方法与其他方法做比较,体现本文方法的有效性。用该方法实现一个动物图像检索系统,争取使动物图像的查重率和查准率都取得不错的结果。

设计功能和性能指标:

系统的功能要求

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1周—第3周 搜集资料,了解相关知识,撰写开题报告;

第4周—第5周 论文开题,给出较为完整的设计方法及方案;

第6周—第12周 撰写论文初稿,编写代码实现各个方面的功能;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 吴茂贵. python深度学习:基于tensorflow [m].北京:机械工业出版社,2018.

[2] 吴茂贵. python深度学习:基于pytorch [m].北京:机械工业出版社,2019.

[3] ian goodfellow,yoshua bengio. 深度学习[m].北京:人民邮电出版社,2017.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。