目标检测损失函数优化算法研究开题报告

 2021-11-15 21:33:28

1. 研究目的与意义(文献综述)

目标检测是计算机视觉的重要任务,用于检测数字图像中特定类别的视觉对象(例如人,动物或汽车)的实例。 目标检测的目的是开发能够提供计算机视觉应用程序所需的最基本信息之一的计算模型和技术。作为计算机视觉的基本问题之一,目标检测构成了许多其他计算机视觉任务的基础,例如实例分割,图像标题,目标跟踪等。从应用的角度来看,目标检测可以分为两个研究主题:“通用目标检测”和“检测应用”,前一个旨在探索一种在统一框架下检测不同类型物体以模拟人类视觉和认知的方法,后一种是指在特定应用场景下的检测,例如行人检测、面部检测、文本检测等。近年来,深度学习技术的快速发展为目标检测带来了新的血液,从而带来了非凡的成就突破,并将其推向研究热点,受到了前所未有的关注。目标检测现已广泛应用于许多实际应用中,例如自动驾驶,机器人视觉,视频监控等。

在过去的二十年中,目标检测的进展大致经历了两个历史时期:“传统目标检测时期(2014年之前)”和“基于深度学习的检测时期(2014年之后)。

对于传统的目标检测算法,具有代表性的方法主要包括hog、vj算法以及dpm。这些方法主要遵循了传统的手工设计的特征,并结合滑动窗口的方式来进行目标检测和定位。传统检测方法基本流程主要包括:首先采用不同大小的滑动窗口遍历输入的图像来得到候选框;然后对候选区域进行特征提取;然后使用事先学习或者训练的分类器对候选区域提取出的特征进行判定,为目标还是背景;最后利用nms非极大抑制算法对候选框进行合并,最终输出检测的目标。由于传统的目标检测算法采用滑动窗口进行区域选择时要遍历整个图像,因此时间复杂度较高且窗口冗余;另外手工设计的特征没有很好的鲁棒性。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

目标检测实现和优化方向包括backbone、iou、损失函数、nms、anchor、one shot learning/zero shot learning等。目前边界框回归损失大部分采用的是回归损失,如l1和l2损失,但是对物体定位准确性的评估却是采用iou,很显然模型的训练和评估之间存在一些差距。国内外研究者针对这一问题,提出了多种改进方法,如giou,diou,ciou等。

毕业设计的任务就是研究最新目标检测算法,并对损失函数进行优化,在标准计算机视觉数据集或高分辨率光学遥感图像或医学影像数据集上训练和测试,对算法和实验结果进行分析和总结。

拟采用的技术方案:

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1.2020.01 ~ 2020.03:从ieee、cnki等国内外数据库中检索深度学习、目标检测相关的文献与资料;经整理、分析和归纳后,明确得出毕业设计的研究背景和意义,完成相关技术的国内外现状调研,完成重要外文文献的翻译工作;期间按照节点撰写周志;

2.2020.03 ~ 2020.04:设计目标检测实验,搭建实验平台,完成数据集预处理,复现出baseline模型。

3.2020.04~ 2020.05:根据设计的方案,精调网络结构和损失函数,优化算法结果;对实验结果做归纳总结,得出有意义的结论,对期间的过程进行提炼、归并处理和拓展,并展望后续的研究工作;期间按照节点撰写周志和中期报告;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]rezatofighi h , tsoi n , gwak j y , et al. generalized intersectionover union: a metric and a loss for bounding box regression[j]. 2019.

[2]zheng z, wang p, liu w, et al. distance-iou loss: faster and better learning for bounding box regression[j]. arxiv preprint arxiv:1911.08287, 2019.

[3]liu z, gao g, sun l. ipg-net: image pyramid guidance network for object detection[j]. arxiv preprint arxiv:1912.00632, 2019.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。