广义主成分分析(GPCA)
原文作者 Reneacute; Vidal, Member, IEEE, Yi Ma, Member, IEEE, and Shankar Sastry, Fellow, IEEE
摘要:本文提出了一种代数几何方法,来将未定数量的未知且不断变化维度的子空间与样本数据点分离。我们将一组齐次多项式应用于这些子空间,齐次多项式的级数等于子空间数,其衍生值在特定的数据点将法向矢量容纳与通过该数据点的子空间。当子空间数量为已知时,我们证明这些多项式可以由数据中线性估出;因此,子空间分割的问题就被简化为将每个子空间的一个点分类。这些子空间中的点是我们从数据集中通过将特定的距离函数极简化以后选出的最优点,并就此以自动化方式处理数据中的中等噪声。将补全每个子空间的基础就通过将标准PCA应用于衍生值集合(法向矢量)的方式得以恢复。此外论文也对GPCA进行拓展衍伸,探讨在多维度空间,内子空间数量未定时的数据处理方法。我们在低维度数据层面做的实验表明GPCA方法比已有的基于多项式因式分解的代数算法更优,并能提供一种好的初始化方式来代替诸如K-子空间(k-subspaces)和期望最大化(EM)这样的方式。论文还从与多重仿射图点对应的观点探讨了将GPCA应用于计算机视觉的相关问题,如人脸聚类,短时视频分割和3D动作分割等。
关键词:指数条款,主成分分析(PCA),子空间分割,Veronese映射,降维,时间
视频分割,动态场景的运动分割
5实验结果及在计算机视觉方面的应用
在这一部分中,我们首先探讨GPCA的性能,对综合生成的数据进行比较,并将它与以下方法结合:
1、多项式的因式分解算法(PFA)。该算法只适用于超平面的情况下。计算法向量到n个超平面的均匀的因式分解多项式成线性因素。详情参见[ 24 ]。
2、k-子空间。给定的初始估计的子空间基地,该算法之间交替聚类使用剩余的不同的数据点的距离子空间和计算每个子空间的基础使用标准的主成分分析。详情参见[ 10 ]。
3、期望最大化(EM)。该算法假定这些数据已损坏的零均值在方向正交高斯噪声子空间。给定的初始估计的子空间基地,EM交替的数据聚类点(步骤),计算每个基础子空间(M)通过最大化对数似然相应的概率模型。进一步了解细节参见[ 19 ]。
然后运用GPCA在计算机中的各种问题视觉人脸聚类不同光照下的,视频时域分割,分割的两种观点线性运动,和刚体的多视点图像分割运动。然而,这不是我们的意图说服读者提出的GPCA算法提供了一个最佳的这些问题的解决方案。事实上,人们可以很容易利用算法获得更好的分割结果专为这些任务的系统。我们只不过想指出GPCA提供了有效的工具自动检测多个空间结构的现状在这些数据集在一个非迭代的方式,提供了一个良好的初始估计的迭代算法。
5.1合成数据实验
实验设置由选项组成一批的平面点选择在。零均值高斯噪声以及s.t.d. 属于百分之 0至百分之5,在子空间法线添加到样本点。我们跑了1000个试验的每个噪声电平。每项试验,之间的真实误差(单位)为法向量和他们的估计计算法向量之间的平均值:
图5A地块的平均误差为n=4函数的噪声。得到了n=2,3相似的结果;尽管有小错误。注意到随着GPCA的估计对选择(见注6)只有那是错误的约百分之五十的错误。这是因为GPCA交易自动选择点噪声数据以最佳的方式。选择的是不重要的(结果是相似)。同时,无论是k-subspaces和EM算法有一个在无噪声情况下的非零误差,表明他们经常收敛到局部最小,当一个单一的随机选择的初始化时使用。当初始化GPCA,无论是k-subspaces和EM算法减少了约50%的误差与随机初始化。最佳的性能是通过使用GPCA初始化k-subspaces和EM算法。
图5B地块GPCA的估计误差作为一个功能研究了子空间的个数n,不同水平的噪声。正如预期的那样,误差迅速增加作为一个功能的N因为GPCA至少需要个数据点,线性估计的多项式(见4.1节)。
表1显示的平均计算时间和平均为每一个MATLAB实现的迭代次数一种算法在1000个试验。在代数算法,速度最快的一个直接因素是PFA给出了。GPCA相对于PFA的额外成本是计算D为所有的分多项式。总的来说,大约一半的错误在大约两倍的时间。还要注意,GPCA降低迭代k-subspaces数和EM近似1 / 3和1 / 2,分别。计算时间k-subspaces和EM也包括额外的时间花在用GPCA或GPCA k-subspaces初始化。
5.2不同光照条件下的人脸聚类
给定一组未标记的n个人脸分别在不同光照条件下的图像,我们期望将同一张人脸的所有图像集为一组。对于一个朗伯对象,我们已从现有资料得知集所有的所有的照明条件下拍摄的图像形成锥在图像的空间,它可以由低维近似子空间[ 10 ]。因此,我们可以集群通过估计为每一个都是根据图像的采集子空间,因为不同的人脸图像将躺在不同的子空间。因为,在实践中,像素数D是大的子空间维数的相比,我们首先应用PCA图像投射到,(见4.1节)。更具体地说,我们计算了奇异值分解数据并且考虑到模型由至组成.我们得到一组数据点从每一列我们利用齐次坐标,每个投影空间,通过考虑的起源。在Yale人脸数据库B组成的一个子集N=64n面正面视图(受试者5,8,和10)在64不同的照明条件。为了计算效率,我们下采样的每个图像D=30*40像素。然后,我们投影数据到主成分,如图6所示。我们采用全局数据齐次坐标和三的线性子空间拟合尺寸为3,2,和2。GPCA获得一个完美的分割,如图6B所示。
5.3视频序列的暂时分割
我们假定一个新闻视频序列,相机在几个场景间不断切换。例如当主播在采访一位嘉宾时,摄像机会在主播、嘉宾、及二者的共同画面间来回切换。如图7A所示。给出了框架的,我们要根据不同的场景聚类。我们假设所有的帧对应于相同的现场直播在税务局的低维子空间,不同的场景,对应于不同的子空间。在人脸聚类的案例,我们可以分割出视频序列在不同的场景中运用GPCA的图像数据投射到前几个主成分。图7B显示两个视频序列分割结果。在这两种情况下,得到了理想的分割效果。
5.4线性运动对象分割
在本节中,我们将GPCA方法应用于分割多个正在进行纯粹平移运动的三维动作分割。我们读者可参考[ 25 ],[ 26 ],来了解在任意旋转和平移的情况下通过一个基本矩阵的混合分割。
我们假设的场景可以被建模为一个混合纯粹的平移运动模型,其中,我代表物体相对于摄像机的翻译两个连续的帧之间。鉴于图像x1和X2一点对象我在第一和第二框架,分别,光线X1,X2和Ti共面。因此X1,X2和Ti必须满足著名的极线线性运动约束
在一个未校准的相机的情况下,极线约束是,其中被称为极点是平移向量线性相关。由于极线约束可以方便改写为
图8显示一个包含一辆卡车和一辆汽车发生两个三维平移运动的视频序列的第一帧320*240。我们运用GPCA D=3,和从总氮N=92功能得到了极线,44在汽车卡车和48。该算法的特点得到了理想的分割效果,如图8b显示,和估计的极点和一个5.9度的误差为汽车的卡车和1.7度。
我们还测试了合成点对应的损坏的零均值高斯噪声与s.t.d. 0和1的500*500像素的图像大小的像素之间的GPCA的性能。为了便于比较,我们还实现了PFA和EM算法在超平面分割。如图。8C和8D显示所有的算法为n=2运动物体的噪声水平函数的性能。性能的措施之间的估计和真实极点的平均误差(度)和平均百分比的正确分割特征点采用1000试验每级噪声。注意,GPCA给小于1.3度的误差和分类性能超过百分之96。因此,GPCA给约1 / 3的粉煤灰的误差,提高了约百分之2的分类性能。还要注意,EM与法向量初始化随机(EM)的收益率在无噪声的情况下,一个非零的错误,因为它经常收敛到一个局部最小值。事实上,我们的算法优于他们。然而,如果我们使用GPCA初始化EM(GPCA EM),这两种算法的性能,提高了,表明我们的算法可以有效地用于初始化为运动分割迭代方法。此外,对GPCA EM迭代次数相对于EM随机初始化的约百分之50;因此,在计算时的增益。如图。8E和8f显示GPCA的数目作为一个不同的噪声水平运动目标函数的性能。正如预期的那样,性能下降的移动物体的数量增加,虽然翻译误差仍然低于8度和分类正确率在百分之78以上。
5.5多重仿射观点之下的三维运动分割
在仿射相机矩阵,这取决于相机的位置和朝向以及内部参数标定。因此,如果我们堆栈中的所有图像测量为矩阵W,我们得到
从(38);因此,在多个帧的图像点,即二维轨迹,W的列,生活在一个空间的尺寸2,3或4 ,跨越的运动矩阵列。
考虑到现在的情况下,点集对应于n行n个不同的移动物体的运动。在这种情况下,每个运动目标跨不同维子空间,其中D=2,3,或4。解决的运动分割问题是相当于找到一个基础的每一个这样的子空间不知道哪些点属于哪个子空间。因此,我们可以运用GPCA的图像测量投影到子空间维数。那就是,如果紫外线是数据矩阵的奇异值分解,然后我们可以运用GPCA的列前五位的运动分割问题的解决。
我们测试了GPCA由移动的相机跟踪车辆在停车场前、建筑物采取两个室外序列(序列A和B),和一个室内的顺序通过移动摄像机跟踪一个人移动他的头被(序列C),如图9所示。对这些序列数据取自[ 14 ]和由点对应多个视图,这在http://www.suri.it.okayama-u.ac.jp/data.html是可用的。所有序列,动作的数量是正确的估计(11)N=2,的所有值。同时,给出了所有三个序列的时序百分之100正确分类的百分比,如表2所示。该表还显示报告[ 14 ]从现有的多帧算法的运动分割结果。的COM坯是有些不公平,因为我们的算法是纯粹的代数,而其他人使用迭代细化处理噪声。然而,唯一的算法具有相当的性能,我们是Kanatani的多级优化算法,它是基于求解一系列的EM迭代的优化问题,在计算费用的显着增加。
外文文献出处:IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 27, NO. 12, DECEMBER 2005 1945
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[287141],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。