区域描述符的性能评估外文翻译资料

 2022-09-19 11:15:25

英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料


区域描述符的性能评估

摘要-----在本文中,我们比较计算为局部感兴趣区域描述符的性能,例如,通过提取哈里斯仿射探测器[32]。许多不同的描述符在文献中被提出。目前还不清楚这些描述符是否比较适当以及他们的表现取决于感兴趣区域探测器上。描述符应鲜明,并在同一时间稳健的观看条件,以及与检测器的错误的变化。我们的评估采用为标准的召回相对于精度,并针对不同的图像变换进行。我们比较形状上下​​文[3],可操纵滤波器[12],PCA-SIFT [19],微分不变式[20],旋图像[21],SIFT [26],复杂的过滤器[37],矩不变量[43],并针对不同的互相关类型感兴趣区域。我们还提出了SIFT描述的延伸,并表明它优于原始方法。此外,我们观察到的描述符的排名是大多独立的兴趣区域检测器的并且基于SIFT-描述表现最佳。矩和可操纵过滤器显示低维的描述中表现最好的。

关键词:局部描述符,兴趣点,感兴趣的区域,不变,匹配,识别。

  1. 引言

局部区域已被证明是在应用光度描述非常成功计算用于兴趣系统蒸发散如宽基线匹配[37],[42],对象识别[10],[25],纹理识别[21],图像检索[29],[38],机器人定位[40],视频数据挖掘[41],建筑全景[4],并识别目标类别[8],[9],[22],[35]。他们是与众不同的,稳健的闭塞,并且不需要分割。最近的工作集中在使这些描述符不变的图像变换。这样做是为了检测图像区域协变到一类变换,然后将其用为支持区域计算不变的描述符。

定不变区域检测器,剩余的问题是该描述符是最合适的,以表征的区域,以及是否的选择描述取决于该地区的探测器上。有一个大可能的描述和相关的距离的数其中强调喜欢不同的图片属性措施像素强度,颜色,质地,边缘等在这项工作中,我们专注于计算的灰度值的图像描述符。

描述符进行评价的结果在执行匹配的背景和识别同一场景或不同的观看条件下观察的对象。 我们已经选择了一些描述符,它们以前在这样的背景下呈现出良好的性能,并采用相同的评估方案,并比较它们相同的测试数据。评价标准是召回高精度,即,在正确的和错误的匹配的数目两个图像。另一种可能的评价标准是ROC(接收者操作特性)的背景下从数据库中的图像检索[6],[31]。检出率等效召回但假阳性率被计算为图像,而不是单个图像对的数据库。 它是因此很难预测的虚假的实际数量一对类似的图像的匹配。

地方特色也被成功地用于对象分类识别和分类。的比较在这种情况下的描述符,需要不同的评价建立。目前还不清楚如何选择有代表性的图像集一个对象类,以及如何准备地面实况既然有内有关图像没有线性变换一个类别。一个可能的解决方案是手动的几个选择对应的点和适用宽松的限制,以验证正确匹配,如在[18]中提出。

在本文中,比较不同的执行描述符,不同感兴趣区域,以及对于不同的匹配的方法。相对于我们以前的工作[31]本文进行了更详尽的评估和引入了一个新描述符。几个描述符和探测器已被添加到该比较和数据集包含一个更大的各种场景类型和转换。我们修改了评价标准,现在使用召回的高精度图像对。顶端的排名

描述符是一样的,在基于ROC评价[31]。此外,我们的新的描述符,渐变的位置和方向直方图(GLOH),它是的一个扩展SIFT描述符中,示出胜过SIFT以及其他描述符。

1.1相关工作

绩效评估已经获得了在计算机视觉[7]越来越多的重视。在匹配的情况下和认可,一些作者的兴趣进行评估点检测器[14],[30],[33],[39]。它的性能由重复性即来测量两幅图像同时存在的百分比。百分比较高两个图像,越点之间的重复率可以匹配得到更好的匹配和识别结果。

很少工作已经对当地的评估已经完成描述符匹配和认可的情况下。卡内罗和杰普森[6]评价点的性能使用ROC(接收者操作特性)的描述。他们表示,他们基于相位的描述进行比差不变好。在他们相比,兴趣点由哈里斯检测器和所检测的图像变换是人为产生的。 最近,柯和Sukthankar[19]也开发了类似的描述符

到SIFT描述符。它适用于主成分分析(PCA),以归一化的图像梯度贴片和性能比SIFT描述符的人为更好产生的数据。该标准召回精度和图像对被用于比较的描述符。

局部描述符(也称为过滤器)也已经在纹理分类的背景下进行评估。 Randen

和赫斯基[36]为一个纹理比较不同的过滤器分类算法。本文评价过滤器是法律口罩,Gabor滤波器,小波变换,DCT变换,本征滤波器,线性预测,优化有限脉冲响应滤波器。没有任何单一的方法被确定为最佳。该分类误差取决于纹理类型和描述符的维数。 Gabor滤波器是在大多数由其他过滤器跑赢案件。瓦玛和Zisserman [44]也比较了纹理分类不同的过滤器,并表明,基于滤波器组,MRF比高斯表现更好。 Lazebnik等[21]提出了一种新的不变的描述称为“旋转图像”,并与比较Gabor滤波器在纹理分类的上下文。他们表明,该基于区域的自旋图像优于点为基础的Gabor滤波器。然而,纹理描述符和纹理分类的结果不能直接换位到区域描述符。区域通常包含一个单一结构不需重复模式和统计依赖经常探讨了质感描述不能在此上下文中使用。

1.2概述

在第二节中,我们介绍了本地艺术的状态描述符。第3节介绍的实施细则在我们的作为比较中使用的检测器和描述符以及我们的评价标准和数据集。在第4节,我们提出的实验结果。最后,我们讨论了结果在第5节。

2描述符

用于描述局部图像区域许多不同的技术已经开发出来。最简单的描述符是一个矢量图像像素。然后互相关可以用来计算两个描述符之间的相似性得分。然而,

在高这样的描述结果的高维计算认可的复杂性。因此,这种技术主要用于发现对应两个图像之间。注意,该区域可以被二次取样以减小尺寸。近日,柯和Sukthankar[19]使用图像梯度补丁和应用提出了PCA降低描述符的大小。

2.1发行基于描述符

这些技术使用直方图来代表不同的外表或形状特征。一个简单的描述是像素强度的分布由一个表示直方图。更表现表示由约翰逊和赫伯特[17]3D物体识别介绍在范围内的数据的情况下。他们表示(旋图像)是在该点的位置的直方图一个3D的兴趣点附近。这是描述最近适于图像[21]。的两个维度直方图是从中心点的距离强度值。

Zabih和Woodfill[45]开发了一种方法稳健的光照变化。它依赖于直方图像素强度之间的订购和互惠关系其比原始像素强度更坚固。该几个相邻的强度之间的二元关系象素由二进制字符串和所有的分布编码可能的组合是由柱状图表示。这个描述符是适于纹理表示但大量维数是需要建立一个可靠的描述符[34]。

洛韦[25]提出了一种尺度不变特征变换(SIFT),它结合了规模不变区域探测器和一个描述符基于梯度分布检测到的区域。描述符是由一个表示梯度的位置和方向的三维直方图; 看到图。 1的图示。该位置的贡献和取向箱由梯度幅值进行加权。梯度的位置和方向的量化使得描述强大的小几何失真和小的误差,该区域的检测。 几何直方图[1]和形状上下文[3]实施同样的思想和非常相似的SIFT描述。 都方法计算描述的区域中的边缘分布的直方图。这些描述符是成功使用的,例如,用于形状识别的图纸对其边缘是可靠的特点。

2.2空间频率的技术

许多技术描述的频率内容图片。傅立叶变换分解图像内容入基础函数。然而,在这种表示中,点之间的空间关系不明确,依据功能是无限的;因此,难以适应当地的做法。该Gabor变换[13]克服这些的问题,但大量的Gabor滤波器的需要

捕获频率和方向的微小变化。 Gabor变换和小波[27]在经常探讨纹理分类的上下文。

米科瓦伊奇克和SCHMID:局部描述符的业绩考核

图1. SIFT描述符: (a) 检测到的区域 (b) 梯度图像和位置网格 (c) 直方图的尺寸 (d) 八个方向四象限 (e) 笛卡尔和日志极位置的网格 对数极坐标显示在造型方面(在角方向的四个)九类用于位置箱。

图2.基于导数过滤器。 (a) 高斯衍生工具上升到第四阶 (b) 复杂的滤波器多达六阶

注意,为使图像简洁,所显示的过滤器不是由高斯加权。

2.3微分描述符

一组图像的衍生物的计算到一个给定的顺序近似于点附近。局部属衍生物(本地喷射)通过Koenderink和Doorn调查面包车的[20]。 Florack等[11]得出的差分不变,其结合本地射流组件获得旋转不变性。弗里曼和阿德尔森[12]发达可操纵滤波器,在其中转向衍生物特定的方向给出的局部射流的组件。在梯度品牌的方向转向衍生品他们不变的旋转,稳定的估计衍生品是通过卷积获得高斯衍生物。 图 2(a)显示了高斯导数4阶。

Baumberg[2]、Schaffalitzky和Zisserman[37]使用从家庭衍生复杂的滤波器提出,不管的方向如何。对于,Baumberg采用高斯衍生物和Schaffalitzky、Zisserman应用多项式(参见3.2节和图2b)。这些过滤器从不同高斯衍生物由线性坐标滤清器更换响应域。

2.4其他技术

广义矩不变量已经被Van Cool [43]等引用于描述的多光谱性质的图像数据。不变量结合中心矩定义为以p q为顺序,a为程度。时刻表征形状和强度分布在一个区域。它们是独立的,并且可以是很容易计算任何顺序和程度。然而,高阶等级的时刻是小敏感几何和光度扭曲。计算不变量降低维数。 这些因此描述符是更适合于彩色图像其中不变量可以计算对于每种颜色信道和信道之间。

3实验装置

在下面,我们首先描述用于该区域检测器在我们的对比和必要的区域正常化用于计算描述符。然后,我们给出的评价描述的实施细节。最后,我们讨论的评价标准和所用的图象数据用在测试中。

3.1支持地区

许多规模和仿射不变区域探测器已在最近提出的。 Lindeberg [23]开发了一个规模不变“斑点”检测,其中一个“斑点”被定义最大在尺度空间的归拉普拉斯。罗威[25]近似于差分的高斯(DOG)滤波器拉普拉斯也检测尺度空间局部极值。 Lindeberg和Ga录制[24]使斑点探测器仿射不变的使用仿射适应过程的基础上二阶矩矩阵。米科瓦伊奇克和施密德[29],[30]用哈里斯的兴趣点的多尺度版探测器在太空定位兴趣点,然后使用Lindeberg的计划为尺度选择和仿射适应。类似的想法是由Baumberg探索[2]以及作为Schaffalitzky和Zisserman [37]。 Tuytelaars和Van GOOL [42]构建两种类型的仿射不变区域,基于感兴趣点和边缘的组合的一个和图像强度的另一个为主。麦塔斯等[28]提出像分割算法的一个分水岭提取的最大稳定极值区域。卡迪尔等 [18]测量像素强度的熵计算了椭圆形的区域直方图找到当地Maxima在仿射变换空间的比较国家艺术仿射地区探测器可以在[33]中找到。

3.1.1区域探测器

检测器提供一种用于将区域计算描述符。如果没有另外说明,则检测尺决定区域的大小。在这评价,我们使用5个检测器:

Harris 点[15]旋转不变点。用于一个固定大小像素以兴趣点为中心。

Harris-Laplace 区域 [29]是不变的旋转和规模的变化。该点由尺度适于检测哈里斯函数和由拉普拉斯高斯的-操作在尺度空间地选择。哈里斯 - 拉普拉斯探测器角落状的结构。

Hessian-Laplace区域[25],[32]是不变旋转和规模的变化。点被在本地定位于空间Hessian行列式的最大值和规模在当地该拉普拉斯 - 高斯的最大值。该探测器是类似狗的方法[26],其中局部点在差分的高斯的局部尺度空间最大值。这两种方法检测类似的斑点状结构。然而,Hessian-Laplace获得更高的定位精度在尺度空间,因为狗也回应边缘和检测在这种情况下是不稳定的。规模选择精度也比Harris-Laplace在检测器的情况下更高。拉普拉斯尺度选择作为一个匹配滤波器和作品上斑点状结构优于上自角拉普拉斯内核的形状适配到斑点。准确度探测器的影响的描述符的性能。

Harris-Affine区域 [32]是不变的仿射图像转换。本地化和规模被估计Harris-Laplace检测器。仿射附近由仿射适配过程根据所述第二确定此刻矩阵。

Hessian-Affine区域[33]是不变的仿射变换图像转换。本地化和规模被估计Hessian-Laplace探测器和仿射邻里通过仿射适应处理确定。

需要注意的是Harris仿射由Harris-Laplace不同仿射适应,这是适用于Harris-Laplace地区。在这个比较中,我们使用相同的区域除即,Harris-Laplace,该区域的形状为圆形。该同样适用于基于Hessian矩阵检测器。因此,该区域的数量为仿射和尺度不变性相同探测器。这些探测器的实现细节,以及作为缺省阈值在[32]中描述。 的数量检测的区域变化范围为200至3000每幅图像取决于内容。

3.1.2区域正常化

探测器提供不同的圆形或椭圆形的区域尺寸,这依赖于检测尺度。鉴于检测区域,有可能通过比例改变其尺寸或形状,并仿射协

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[148409],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。