基于PyTorch的物体检测识别实现文献综述

 2022-09-22 11:52:16

文献综述(或调研报告):

  • 背景介绍

在人们日常生活中,人们对外界事物的认知,大部分是来自于视觉信息。随着时代的发展,人们在日常生活中会接触到大量的图像及视频信息,如何对这些数据进行高效地处理时计算机视觉领域的主要任务[1]。目标检测是计算机视觉领域的一个重要任务,它可以帮助人们有效的解析自然图像的有效信息,可以帮助人们更精确、高效地工作和学习。例如,机器人的工作少不了对目标的识别,现有的机器人主要包括用于工业抓取的机器人、用于家庭服务的机器人和用于服务行业的机器人等[2]。在上诉的这些机器人中,一个核心的组件就是视觉系统组件,扫地机器人需要识别障碍物,工业抓取机器人需要定位目标物体来帮助抓取。同时,在目前很前沿的自动驾驶领域,目标检测也占据着举足轻重的地位,它帮助车辆识别和障碍物、行人及红绿灯等重要信息[3]。目前检测作为计算机视觉的重要组成部分,它的基本任务主要有两类,就是分类和定位[4]

  • 研究现状

1.物体检测研究现状

针对不同的待检测目标,国内外学者提出了各种识别与检测的算法和模型。特别是今年来,深度神经网络技术的发展,是的目标检测效果更上一层楼。现有的目标检测技术基本上分为三个步骤:候选区域推荐/区域分割、特征表示和区域分类[5][6]。首先通过滑动窗口或者区域分割的方法推荐出图像中可能存在的物体目标的区域位置,即候选区域;然后采用合适的特征或模型对这些区域进行表示,得到这些区域的特征向量[7][8];最后通过分类器对各个区域的特征矢量进行分类,判断区域中是否包含待检测目标,并通过如非极大值抑制、边框位置回归等方法得到最终感兴趣的边框[9]

2.Pytorch框架

对象识别需要多次进行卷积计算,池化运算,以及梯度运算。Pytorch框架提供大量符合对象识别运算的API,可以便捷的实现识别算法,降低工作量。除此之外,Pytorch可以建立动态的神经网络,能更有效的处理问题。

3.主要算法

(1)Faster R-CNN

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。