1. 研究目的与意义
道路作为重要的地理要素,在城市规划、经济发展和数字城市构建中有着举足轻重的地位。在过去几十年的研究中,许多学者和研究人员已经投入大量时间和精力来研究如何提取道路尤其是公路、城市中的主干道等。研究方法随着科技的进步不断发展,从早期的利用测量仪器进行传统测量提取所需要的道路信息,到了摄影测量与遥感时期,随着高分辨率影像的诞生,遥感影像信息越来越丰富,从高分辨率遥感影像中提取道路信息成为目前比较热门的研究内容。 基于高分辨率遥感影像的道路信息提取,国内外学者都给出了很多可行思路和有效的方法。大致可以分为两类:一类是半自动提取道路信息;另一类是全自动提取道路信息。半自动道路提取是利用人机交互的方式进行,其思路是人工提供道路的初始点和道路方向,然后让计算机按照一定规则进行提取,期间还夹杂着人机交互,保证识别的准确性。全自动道路提取的方法是利用道路在影像中的特征,使用计算机全自动从影像中提取出道路信息[1]。而遥感影像道路提取是根据遥感影像自身的信息,通过某种算法提取道路独有的各类特征并将其分割为2个互不相交的子空间,进而将符合道路特征的像素划分到道路子空间,其余像素为非道路。但是由于高分辨率遥感影像的光谱特征非常丰富,“同物异谱”和“异物同谱”现象非常明显,因此传统的基于像元的方法如光谱分析、阈值分析、边缘检测等简单实现但容易产生噪声,导致误判,使得提取准确度很低。传统的面向对象方法如最邻近、支持向量机、隶属度函数、知识模型等直接对对象的信息进行建模,将图像进行初始分割或者块状的小区域,通过将同质区域合并得到道路对象,容易导致过度提取。 近年来计算机技术飞速发展,语义分割算法也得到了很大的改进,卷积神经网络(convolutionalneural network, CNN)[2]被广泛应用,张庆辉等[3]利用卷积神经网络进行道路目标检测,但是由于CNN使用了较大的接受域,提取的道路边缘粗糙。Jonathon等[4]提出了全卷积网络(fully convolutionalneural network, FCN) ,使得卷积神经网络无需全连接层即可进行密集的像素预测,可接受任意尺寸的输入。钟传琦[5]利用改进的全卷积神经网络进行了道路提取实验,发现提取的道路缺乏空间一致性。Ronneberger等[6]提出了U-Net,通过将特征在通道维度进行拼接,形成更厚的特征,从而能够适应很小的训练。但是,实验发现U-Net在分割时收敛速度较慢,而且道路边缘分割效果不理想[7]。 而人行道作为道路系统的一部分,是以人类为中心的城市环境中重要的基础设施,一方面,随着城市居民的环保意识、健康意识的增强,越来越多的人们选择步行,换句话说,人行道的质量同时也是居民生活水平的重要体现;而另一方面,随着社会的发展,一些特殊人群的需求也更加得到重视,例如盲人需要的盲道,同时也体现着社会的公平和包容,所以人行道在城市的发展中发挥着愈来愈重要的作用。因此人行道的提取逐渐成为研究人员们关心的话题,考虑到人行道的几何特性以及易被城市绿化或建筑物遮挡,一种利用街景图像与航拍影像相结合、更新速度快、生产成本低廉的方法是极为迫切的。使用航摄影像资料提取人行道时,CNN不能提取出被遮挡或处在阴影里的人行道部分,就会出现人行道部分被遮挡或者是断开的现象。 针对街景影像分割,在过去的数十年里,视觉图像界已经在实例分割方面取得了卓越的成就,部分是通过基于十分完善的对象探测领域。一些用来实例分割的方法例如Mask R-CNN[8]和FCIS[9],这两者是直接吸取了对象探测例如Faster R-CNN[10]和R-FCN[11],但是这些方法皆重视结果而非速度,这就导致了相比于实时对象探测器,实时实例分割技术十分缺乏成熟。与上述分割方法相比,YOLACT模型[12]有很多优势:第一也是最为重要的一点,它的处理速度很快;第二,生成的结果是高质量的,精度非常高;第三,它的综合性,几乎所有的对象探测器都可以添加这种生成模型和参数。我们就需要一种新的模型——YOLACT模型和将航摄影像与街景影像相结合的方法来训练提取人行道。
|
2. 研究内容和预期目标
本课题的主要研究内容是利用google的街景地图数据,训练yolact模型对影像中的人行道进行分割提取,其中涉及到了深度学习,而如何实现影像坐标系与地理坐标系之间的转换成为研究的一个重要问题,包括研究最后的效果测试和精度分析问题。
本课题的预期目标即由于在遥感影像中有些人行道出现部分路段被遮挡甚至是完全被遮挡,现有的方法无法正确高效地提取出人行道,将google街景数据作为补充,yolact模型进行实时分割,能够快速高效低成本地提取出航摄影像无法得到的人行道,且精度符合要求。
3. 研究的方法与步骤
一、收集航空影像
航空影像的分辨率至关重要。人行道的宽度很小,平均约1.2-1.5米。因此,图像的人行道在0.3米的高架图像中拥有4–5像素。在较低分辨率的图像中,很难检测到少于4个像素的人行道。在这项研究中不需要红外波段,因为植被的可分辨性不会影响人行道的提取。
二、从航空影像中提取人行道
4. 参考文献
[1]顾红军.基于高分辨率遥感影像的道路网信息提取研究现状[J].中国非金属矿工业导刊,2018(4):53-54. [2]LECUNY, BOTTOUL, BENGIOY, etal.Gradient based learning applied to document recognition[J].Proceedings of theIEEE,1998,86(11):2278-2324. [3]张庆辉,万晨霞,秦淑英,等.基于卷积神经网络的道路目标检测算法[J].计算机工程于设计2019,40(7):2052-2053. [4]JONATHANL, SHELHAMERE, DARRELLT,etal. Fully convolutional networks for semantic segmentation[J].ComputerVision and Pattern Recognition,2015:3431-3440. [5]钟传琦.基于深度学习的高分辨率遥感影像道路自动提取研究[D].成都:电子科技大学,2018. [6]RONNEBERGERO, FISCHERP, BROXT.U-Net: convolutional network for biomedical imagesegmentation[C]//Proceedings of International Conference on Medical ImageComputing and Computer-assisted Intervention.Berlin:Springer,2015:234-241. [7]韩玲,杨朝辉,李良志,刘志恒,黄勃学.利用Deeplab v3提取高分辨率遥感影像道路[J].遥感信息,2021(2):22-28. [8]Kaiming He, GeorgiaGkioxari, Piotr Dollar, and Ross Gir- ′ shick. Mask r-cnn. In ICCV, 2017. [9] Yi Li, Haozhi Qi, JifengDai, Xiangyang Ji, and Yichen Wei. Fully convolutional instance-awaresemantic segmentation. In CVPR, 2017. [10] Jifeng Dai, Yi Li,Kaiming He, and Jian Sun. R-fcn: Object detection via region-based fullyconvolutional networks. In NeurIPS, 2016. [11] Shaoqing Ren, Kaiming He,Ross Girshick, and Jian Sun. Faster r-cnn: Towards real-time object detectionwith region proposal networks. In NeurIPS, 2015. [12]Bolya, D., Zhou, C., Xiao,F., Lee, Y.J., 2019. YOLACT: Real-time Instance Segmentation. ArXiv190402689Cs. [13]HuanNing, Xinyue Ye, Zhihui Chen, 2021. Sidewalk extraction using aerial and street view images.Environmentand Planning B: Urban Analytics and City Science.
|
5. 计划与进度安排
1、2022-3-22至2022-4-11:接受任务,了解指导教师对论文的要求和工作内容。根据论文题目阅读指导教师规定的文献,通过网络、期刊、专业书籍等进行相关背景资料收集和综述,撰写开题报告。
2、2022-4-12至2022-4-25:软件学习、方案设计、数据收集阶段。
3、2022-4-26至2022-5-9:方案调整及实证阶段。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。