1. 研究目的与意义(文献综述)
人类感知外界信息,80%是通过视觉得到的[1],三维(3d)重建是计算机视觉最重要的研究问题之一,在计算机辅助几何设计(cagd)、计算机图形学(cg)、计算机动画、计算机视觉、医学图像处理、科学计算和虚拟现实、数字媒体创作等领域具有广泛的应用。在计算机内生成物体三维表示主要有两类方法。一类是使用几何建模软件通过人机交互生成人为控制下的物体三维几何模型,另一类是通过一定的手段获取真实物体的几何形状。前者实现技术已经十分成熟,现有若干软件支持,比如:3dmax、maya、autocad、ug等等,它们一般使用具有数学表达式的曲线曲面表示几何形状。后者一般称为三维重建过程,三维重建是指利用二维投影恢复物体三维信息(形状等)的数学过程和计算机技术,包括数据获取、预处理、点云拼接和特征分析等步骤。其中运动恢复结构(sfm)是通过分析物体,确定三维图像的对应点重构出物体三维场景。使用运动恢复结构来进行3d重建是低成本而有效的[2],一个典型的运动恢复结构算法涉及到下面的若干个步骤:图像特征提取,估计场景的初始结和相机运动,优化估计的结果,标定相机,得到场景的稠密描述,推导场景的几何、纹理以及反射属性.其主要困难在于重建问题自身的二义性、图像噪声和光照编号的干扰以及前景遮挡,重建效果不够理想,亟需优化。同时现有算法耗时,无法满足实时应用需求。
基于运动恢复结构的3d重构技术是在20世界90年代开发出来的[3]。使用运动恢复结构(sfm)方法需要的成本很低,同时大量的数据采集降低了用户的监督耗时和所要求的专业知识[4]。解决匹配特性的三维位置问题,最流行的是采用sift算法,这种方法是david lowe在1999年提出,在2004年加以完善[5-6]。然后是三维场景重建,这方面有ransac算法进行关键点匹配,它于1981年由fischler和bolles最先提出[7]。然后是后期处理和数字高程模型生产,这个方面有rychkov等人(2012)开发的网格化过程[8]。国内对三维重建的研究有,清华大学的孙家广,汪国平,刘世霞提出的基于三维视图形体的重建算法[9];电子科技大学的赵必玉,实现了基于投影仪-摄像机三角测量系统的3d重建[10]。
本课题研究利用手机采集的刚性物体图像序列,通过对图像序列的特征提取、估计相机运动、标定相机等步骤恢复出刚性物体三维模型,同时利用相机成像几何以及场景结构先验信息,提高重建算法的准确度。基于运动恢复结构的3d重构算法相比于传统的方法我认为最重要的就是低成本和高效性,它降低了3d重构算法研究的门槛,开发出一个只需电脑和手机就能进行3d重构的系统,是本文的目标。
参考文献:
2. 研究的基本内容与方案
基本内容:
1)通过阅读文献,了解图像特征点提取算法,以及确定多幅图像的对应点。熟悉相机成像原理,对相机进行标定。
2)总结现有3d重建技术,分析各方法的特点及优劣。重点研究采用运动恢复结构算法原理,特别是分析三维重建算法在图像噪声、光照变化下的重构效果。研究利用刚性物体几何信息,提高重构效果。
3. 研究计划与安排
(1)2016/1/11—2016/1/22:查阅参考文献,明确选题;
(2)2016/1/23—2016/3/7:进一步阅读文献,并分析和总结;确定技术路线,完成并提交开题报告;
(3)2016/3/8—2016/4/26:需求分析,算法或系统设计,分析、比较或实现等;
4. 参考文献(12篇以上)
[1] nistér d. preemptive ransac for live structure and motion estimation[j]. machine vision and applications, 2005, 16(5): 321-329.
[2] niebles j c, chen c w, fei-fei l. modeling temporal structure of decomposable motion segments for activity classification[m]//computer vision-eccv 2010. springer berlin heidelberg, 2010: 392-405.
[3] brostow g j, shotton j, fauqueur j, et al. segmentation and recognition using structure from motion point clouds[m]//computer vision–eccv 2008. springer berlin heidelberg, 2008: 44-57.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。