1. 研究目的与意义
立体视觉是机器视觉的一种重要形式,它是基于视差原理,利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。和主动式的、常适用于室外环境的程距法不同,是一种被动方式的立体视觉方法。但是却十分适合工业制造、计算机等室内环境。
立体视觉主要分为四个步骤:图像获取、图像校正、立体匹配和三维重建。其中,立体匹配的目的是在两个或多个对应同一场景的图像中找到匹配点(即同名点),进而生成视差图。而视差图可以通过一些简单的几何关系转换成深度图,以用于三维重建。立体匹配是计算机视觉领域一个瓶颈问题,其结果的好坏直接影响着三维重建的效果。
在立体视觉中,对应点的匹配算法大致分为三类:区域匹配、特征匹配和相位匹配。本篇将对区域匹配的sad、ssd、ncc方法进行研究分析并进行性能评估等。
2. 课题关键问题和重难点
本课题主要分成资料整合、仿真程序(算法)编写及调试、仿真、性能评估、总结报告几个步骤。其中前2个步骤是重点。
资料整合步骤主要是参考资料,了解同名点匹配问题相关原理和算法概述,以便后继研究进行。因为有部分英文参考文献,需仔细分析。
仿真程序(算法)编写及调试是本课题的最重点也是最难点。实验因为要对多幅图像这种大量数据进行处理,所以需要用到matlab。除了基本算法外,还要考虑可以方便调节参数的要求。此外,由于程序的不唯一性,可能出现的运行错误是可以预见的,需要一定的调试。而在研究的3个算法中sad、ssd是较为基础的算法,可以较快完成,ncc方法较为复杂,是几个算法中的难点,可能需要多加尝试,如何快速运算、简化运算是关键性问题。
3. 国内外研究现状(文献综述)
立体视觉是机器视觉领域的一个重要组成,其目的在于重构目标场景的三维几何信息。
立体视觉的研究方法可以分为主动式和被动式两类:
主动式方法又叫做程距法,常适用于室外环境。该法常直接利用测距仪器,如激光测距器,来获得程距值和深度图,用数值逼近的方法重建表面信息,再根据模型建立场景中的物体描述来实现图像理解功能。简单的说,主动式立体视觉是直接测量然后直接建立三维模型。
4. 研究方案
首先,从数据来源方面,为了减少因为原始数据(图像)差异造成的影响,决定使用立体匹配标准图集,即Middlebury图集进行研究。
然后,从顺序上,在参考资料后决定先采用较为简单的SAD、SSD方法实现同名点匹配,然后在完成相应部分后尝试采用NCC方法实现同名点匹配。
考虑到数据运算量,研究工具使用MATLAB。
具体流程如下:
MATLAB处理,仿真,调试 |
资料 整合 |
立体匹配标准图集 |
SAD |
SSD |
NCC |
匹配结果 |
性能评估 |
论文 |
5. 工作计划
第1周:整合资料,理解课题相关原理,以及未来前景。
第2周:继续搜寻相关资料,进行外文资料翻译,对国内外对研究问题的处理方法区别稍作了解。
第3周:确定方案,拟定实验模型,初拟开题报告。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。