现代状态估计通常被表达为优化问题,并使用有效的本地搜索方法解决。这些方法最能保证与本地最小值的融合,但是在某些情况下,全球最优性也可以得到认证。尽管此类全球最佳证书已经为3D姿势格言优化确定了,但是对于基于3D地标的SLAM问题,尚未确定细节,其中估计的状态包括机器人姿势和地图地标。在本文中,我们通过使用图理论方法来解决这一差距,将基于里程碑的SLAM的子问题投入到一种形式,该形式产生了足够的全球最优状态。存在计算这些子问题的最佳证书的有效方法,但首先需要构建大型数据矩阵。我们表明,该矩阵可以以复杂性构建,该复杂性在地标数量中保持线性,并且不超过一个局部求解器的最新计算复杂性。最后,我们证明了证书对基于模拟和现实世界标记的大满贯问题的功效。
translated by 谷歌翻译
定位移动机器人的一种常见方法是测量已知位置点的距离,称为锚点。从距离测量值中定位设备通常是由于测量模型的非线性而作为非凸优化问题。当使用局部迭代求解器(如高斯 - 牛顿)时,非凸优化问题可能会产生次优的解决方案。在本文中,我们为连续范围的本地化设计了最佳证书。我们的公式可以整合运动,从而确保溶液的平滑度,并且对于仅从几个距离测量值进行定位至关重要。拟议的证书几乎没有额外的成本,因为它的复杂性与稀疏本地求解器本身的复杂性相同:位置数量的线性。我们在仿真和现实世界数据集中显示,有效的本地求解器通常会找到全球最佳解决方案(通过我们的证书确认),而当没有证书确认时,简单的随机重新初始化最终会导致可认证的最佳选择。
translated by 谷歌翻译
在没有对其相对姿势的准确估计的情况下,无法正确融合来自两个传感器的数据,这可以通过外部校准的过程来确定。当两个或更多个传感器能够产生自己的eGomotion估计(即,通过环境测量它们的轨迹),可以采用“手眼”外部校准的制定。在本文中,我们将最近的工作扩展到凸优化方法,以便手眼校准到一个传感器不能观察其翻译运动的比例(例如,观察未拍摄环境的单眼摄像机)。我们证明我们的技术能够为手眼校准的已知和未知级别的变体提供认真的全球最佳解决方案,只要测量噪声被界定。这里,我们专注于问题的理论方面,展示了我们解决方案的密封性和稳定性,并通过合成数据的实验展示了我们算法的最优性和速度。
translated by 谷歌翻译
在这项工作中,我们介绍了配备有明确性能的第一个初始化方法,该方法适用于姿势图同时定位和映射(SLAM)和旋转平均(RA)问题。 SLAM和旋转平均通常正义为大规模的非渗透点估计问题,具有许多糟糕的本地最小值,可以捕获通常应用的平滑优化方法来解决它们;因此,标准SLAM和RA算法的性能至关重要取决于用于初始化该本地搜索的估计的质量。虽然在文献中出现了SLAM和RA的许多初始化方法,但通常可以获得纯粹的启发式近似值,这使得难以确定是否(或在什么情况下)这些技术可以可靠地部署这些技术。相比之下,在这项工作中,我们研究通过光谱松弛镜头初始化的问题。具体而言,我们推出了SLAM和RA的简单谱弛豫,其形式使我们能够利用经典的线性代数技术(特征向量扰动界限)来控制从我们的光谱估计到(未知)地基实际和该距离作为测量噪声的函数的估计问题的全局最小化器。我们的结果揭示了测量网络在控制估计精度下播放的光谱图 - 理论性能的关键作用;此外,作为我们分析的副产物,我们在估计误差上获得了最大似然估计的估计误差,这可能具有独立兴趣。最后,我们在实验上展示了我们的光谱估计器在实践中非常有效,与现有的最先进技术相比,在较低的计算成本下生产可比或优异质量的初始化。
translated by 谷歌翻译
量化不确定性是主动同时本地化和映射(SLAM)的关键阶段,因为它允许确定执行的最有用的动作。但是,处理完整的协方差甚至Fisher信息矩阵(FIMS)在计算上是沉重的,并且很容易在线系统上棘手。在这项工作中,我们研究了通过\ textit {se(n)}提出的主动图 - 峰的范式,并提出了系统FIM与基础姿势的拉普拉斯矩阵之间的一般关系。此链接使使用图形连接索引作为具有最佳保证的实用程序函数,因为它们近似源于最佳设计理论的众所周知的最佳标准。实验验证表明,所提出的方法会导致在一小部分时间内进行主动猛击的等效决策。
translated by 谷歌翻译
我们考虑了一个类别级别的感知问题,其中给定的2D或3D传感器数据描绘了给定类别的对象(例如,汽车),并且必须重建尽管级别的可变性,但必须重建对象的3D姿势和形状(即,不同的汽车模型具有不同的形状)。我们考虑了一个主动形状模型,其中 - 对于对象类别 - 我们获得了一个潜在的CAD模型库,描述该类别中的对象,我们采用了标准公式,其中姿势和形状是通过非非2D或3D关键点估算的-convex优化。我们的第一个贡献是开发PACE3D*和PACE2D*,这是第一个使用3D和2D关键点进行姿势和形状估计的最佳最佳求解器。这两个求解器都依赖于紧密(即精确)半决赛的设计。我们的第二个贡献是开发两个求解器的异常刺激版本,命名为PACE3D#和PACE2D#。为了实现这一目标,我们提出了Robin,Robin是一种一般的图理论框架来修剪异常值,该框架使用兼容性超图来建模测量的兼容性。我们表明,在类别级别的感知问题中,这些超图可以是通过关键点(以2D)或其凸壳(以3D为单位)构建的,并且可以通过最大的超级计算来修剪许多异常值。最后的贡献是广泛的实验评估。除了在模拟数据集和Pascal数据集上提供消融研究外,我们还将求解器与深关键点检测器相结合,并证明PACE3D#在Apolloscape数据集中在车辆姿势估算中改进了最新技术,并且其运行时间是兼容的使用实际应用。
translated by 谷歌翻译
Outier-bubust估计是一个基本问题,已由统计学家和从业人员进行了广泛的研究。在过去的几年中,整个研究领域的融合都倾向于“算法稳定统计”,该统计数据的重点是开发可拖动的异常体 - 固定技术来解决高维估计问题。尽管存在这种融合,但跨领域的研究工作主要彼此断开。本文桥接了有关可认证的异常抗衡器估计的最新工作,该估计是机器人技术和计算机视觉中的几何感知,并在健壮的统计数据中并行工作。特别是,我们适应并扩展了最新结果对可靠的线性回归(适用于<< 50%异常值的低外壳案例)和列表可解码的回归(适用于>> 50%异常值的高淘汰案例)在机器人和视觉中通常发现的设置,其中(i)变量(例如旋转,姿势)属于非convex域,(ii)测量值是矢量值,并且(iii)未知的异常值是先验的。这里的重点是绩效保证:我们没有提出新算法,而是为投入测量提供条件,在该输入测量值下,保证现代估计算法可以在存在异常值的情况下恢复接近地面真相的估计值。这些条件是我们所谓的“估计合同”。除了现有结果的拟议扩展外,我们认为本文的主要贡献是(i)通过指出共同点和差异来统一平行的研究行,(ii)在介绍先进材料(例如,证明总和证明)中的统一行为。对从业者的可访问和独立的演讲,(iii)指出一些即时的机会和开放问题,以发出异常的几何感知。
translated by 谷歌翻译
The affine rank minimization problem consists of finding a matrix of minimum rank that satisfies a given system of linear equality constraints. Such problems have appeared in the literature of a diverse set of fields including system identification and control, Euclidean embedding, and collaborative filtering. Although specific instances can often be solved with specialized algorithms, the general affine rank minimization problem is NP-hard, because it contains vector cardinality minimization as a special case.In this paper, we show that if a certain restricted isometry property holds for the linear transformation defining the constraints, the minimum rank solution can be recovered by solving a convex optimization problem, namely the minimization of the nuclear norm over the given affine space. We present several random ensembles of equations where the restricted isometry property holds with overwhelming probability, provided the codimension of the subspace is Ω(r(m + n) log mn), where m, n are the dimensions of the matrix, and r is its rank.The techniques used in our analysis have strong parallels in the compressed sensing framework. We discuss how affine rank minimization generalizes this pre-existing concept and outline a dictionary relating concepts from cardinality minimization to those of rank minimization. We also discuss several algorithmic approaches to solving the norm minimization relaxations, and illustrate our results with numerical examples.
translated by 谷歌翻译
本说明使用总平方(TLS)线路拟合问题作为探索一些现代优化工具的画布。该贡献本质上是教程。TLS问题与机器人技术和计算机视觉中的重要问题具有很大的数学相似性,但更易于可视化和理解。我们演示了如何将此问题转变为四二次二次程序(QCQP),以便可以将其作为本本特征问题或半明确程序(SDP)施放。然后,我们转向更具挑战性的情况,在这种情况下,Geman-McClure成本函数和M估计用于拒绝离群数据标记。使用Black-rangarajan二元性,我们表明它也可以施加为QCQP并将其求解为SDP。但是,有了大量数据,SDP可能会很慢,因此我们展示了如何为更快的方法(例如迭代重新加权最小二乘(IRLS))构建最佳证书。
translated by 谷歌翻译
长期以来,部署能够探索未知环境的自动驾驶机器人一直是与机器人社区有很大相关性的话题。在这项工作中,我们通过展示一个开源的活动视觉猛烈框架来朝着这个方向迈出一步基础姿势图提供的结构。通过仔细估计后验加权姿势图,在线实现了D-最佳决策,目的是在发生探索时改善本地化和映射不确定性。
translated by 谷歌翻译
我们描述了一种使用机器人应用程序中常见的一类离散连续因子图进行平滑和映射的通用方法。虽然有公开可用的工具提供灵活且易于使用的接口,以指定和解决以离散或连续图形模型提出的优化问题,但目前尚无类似的一般工具,可以为混合离散性问题提供相同的功能。我们旨在解决这个问题。特别是,我们提供了一个库DC-SAM,将现有的工具扩展为以因子图定义的优化问题,以设置离散模型的设置。我们工作的关键贡献是一种新颖的解决方案,用于有效地回收离散连续优化问题的近似解决方案。我们方法的关键见解是,虽然对连续和离散状态空间的共同推断通常很难,但许多通常遇到的离散连续问题自然可以分为“离散部分”,并且可以轻松地解决的“连续部分” 。利用这种结构,我们以交替的方式优化离散和连续变量。因此,我们提出的工作可以直接表示离散图形模型的直接表示和近似推断。我们还提供了一种方法来恢复离散变量和连续变量的估计值的不确定性。我们通过应用于三个不同的机器人感知应用程序的应用来证明我们的方法的多功能性:点云注册,健壮的姿势图优化以及基于对象的映射和本地化。
translated by 谷歌翻译
姿势图优化是在机器人感知的许多领域遇到的非凸优化问题。它的收敛到准确的解决方案由两个因素来调节:使用成本函数的非线性和姿势变量的初始配置。在本文中,我们提出了Hipe,这是一种用于姿势图初始化的新型分层算法。我们的方法利用了一个粗粒图,该图编码了问题几何形状的抽象表示。我们通过结合来自输入本地区域的最大似然估计来构建此图。通过利用这种表示的稀疏性,我们可以以非线性方式初始化姿势图,而无需与现有方法相比,没有计算开销。最终的初始猜测可以有效地引导用于获得最终解决方案的细粒优化。此外,我们对不同成本函数对最终估计的影响进行了经验分析。我们的实验评估表明,HIPE的使用导致更有效,更健壮的优化过程,与最先进的方法相比。
translated by 谷歌翻译
解决逆运动学问题是针对清晰机器人的运动计划,控制和校准的基本挑战。这些机器人的运动学模型通常通过关节角度进行参数化,从而在机器人构型和最终效果姿势之间产生复杂的映射。或者,可以使用机器人附加点之间的不变距离来表示运动学模型和任务约束。在本文中,我们将基于距离的逆运动学的等效性和大量铰接式机器人和任务约束的距离几何问题进行形式化。与以前的方法不同,我们使用距离几何形状和低级别矩阵完成之间的连接来通过局部优化完成部分欧几里得距离矩阵来找到逆运动学解决方案。此外,我们用固定级革兰氏矩阵的Riemannian歧管来参数欧几里得距离矩阵的空间,从而使我们能够利用各种成熟的Riemannian优化方法。最后,我们表明,绑定的平滑性可用于生成知情的初始化,而无需大量的计算开销,从而改善收敛性。我们证明,我们的逆运动求解器比传统技术获得更高的成功率,并且在涉及许多工作区约束的问题上大大优于它们。
translated by 谷歌翻译
反向运动学(IK)是找到满足一个或多个末端效应器的位置或姿势的限制的机器人联合配置的问题。对于具有冗余自由度的机器人,通常存在无限,不透露的解决方案。当通过工作空间中的障碍施加碰撞限制时,IK问题进一步复杂。通常,不存在产生可行配置的闭合表达,促使使用数值解决方案方法。然而,这些方法依赖于局部优化非凸起问题,通常需要准确的初始化或许多重新初始化来收敛到有效的解决方案。在这项工作中,我们首先将复杂的工作空间约束制定逆运动学,作为凸的可行性问题,其低级可行点提供精确的IK解决方案。然后,我们呈现\ texttt {cidgik}(距离 - 几何反向运动学的凸迭代),这是一种解决这种可行性问题的算法,其具有旨在鼓励低秩最小化的半导体级程序的序列。我们的问题制定优雅地统一机器人的配置空间和工作空间约束:内在机器人几何形状和避免避免都表示为简单的线性矩阵方程和不等式。我们对各种流行的操纵器模型的实验结果比传统的非线性优化的方法更快,更准确的会聚,特别是在具有许多障碍的环境中。
translated by 谷歌翻译
束调整(BA)是指同时确定传感器姿势和场景几何形状的问题,这是机器人视觉中的一个基本问题。本文为LIDAR传感器提供了一种有效且一致的捆绑捆绑调整方法。该方法采用边缘和平面特征来表示场景几何形状,并直接最大程度地减少从每个原始点到各自几何特征的天然欧几里得距离。该公式的一个不错的属性是几何特征可以在分析上解决,从而大大降低了数值优化的维度。为了更有效地表示和解决最终的优化问题,本文提出了一个新颖的概念{\ it point clusters},该概念编码了通过一组紧凑的参数集与同一特征相关联的所有原始点,{\ it点群集坐标} 。我们根据点簇坐标得出BA优化的封闭形式的衍生物,并显示其理论属性,例如零空间和稀疏性。基于这些理论结果,本文开发了有效的二阶BA求解器。除了估计LiDAR姿势外,求解器还利用二阶信息来估计测量噪声引起的姿势不确定性,从而导致对LIDAR姿势的一致估计。此外,由于使用点群集的使用,开发的求解器从根本上避免了在优化的所有步骤中列出每个原始点(由于数量大量而非常耗时):成本评估,衍生品评估和不确定性评估。我们的方法的实施是开源的,以使机器人界及其他地区受益。
translated by 谷歌翻译
凸(特别是半决赛)放松提供了一种强大的方法来构建健壮的机器感知系统,从而使在许多实际情况下确切地恢复了全球最佳的挑战估计问题的最佳解决方案。然而,解决这种方法的大规模半决赛松弛仍然是一项巨大的计算挑战。在许多最先进的(基于孟买分解)可认证的估计方法的主要成本是解决方案验证(测试给定候选解决方案的全球最佳性),这需要计算一定的对称证书矩阵的最低特征型。 。在本文中,我们展示了如何显着加速此验证步骤,从而使可认证的估计方法的总体速度。首先,我们表明,在Burer-Monteiro方法中产生的证书矩阵通常具有光谱,使验证问题使用标准的迭代特征值方法昂贵。然后,我们展示了如何使用预处理的特征材料来应对这一挑战;具体而言,我们根据局部最佳块预处理共轭梯度(LOBPCG)方法设计了一种专门的解决方案验证算法,并使用简单但高效的代数预处理。对各种模拟和现实世界的实验评估表明,我们提出的验证方案在实践中非常有效,可以通过多达280倍加速溶液验证,而总体burer-monteiro方法最多可通过16倍,而当标准Lanczos方法与标准的Lanczos方法相比适用于源自大规模巨大基准测试的松弛。
translated by 谷歌翻译
本文提出了Kimera-Multi,第一个多机器人系统,(i)是强大的,并且能够识别和拒绝由感知混叠产生的不正确和内部机器人循环闭合,(ii)完全分布,仅依赖于本地(点对点)通信实现分布式本地化和映射,(iii)实时构建环境的全球一致的度量标准三维网状模型,其中网格的面部用语义标签注释。 Kimera-Multi由配备有视觉惯性传感器的机器人团队实现。每个机器人都构建了局部轨迹估计和使用Kimera的本地网格。当通信可用时,机器人基于一种基于新型分布式刻度非凸性算法发起分布式地点识别和鲁棒姿态图优化协议。所提出的协议允许机器人通过利用机器人间循环闭合而鲁棒到异常值来改善其局部轨迹估计。最后,每个机器人使用其改进的轨迹估计来使用网格变形技术来校正本地网格。我们在光逼真模拟,SLAM基准测试数据集中展示了Kimera-Multi,以及使用地机器人收集的靠户外数据集。真实和模拟实验都涉及长轨迹(例如,每个机器人高达800米)。实验表明,在鲁棒性和准确性方面,kimera-multi(i)优于现有技术,(ii)在完全分布的同时实现与集中式大满贯系统相当的估计误差,(iii)在通信带宽方面是显着的(iv)产生精确的公制语义3D网格,并且(v)是模块化的,也可以用于标准3D重建(即,没有语义标签)或轨迹估计(即,不重建3D网格)。
translated by 谷歌翻译
我们提出了一种凸锥程序,可推断随机点产品图(RDPG)的潜在概率矩阵。优化问题最大化Bernoulli最大似然函数,增加核规范正则化术语。双重问题具有特别良好的形式,与众所周知的SemideFinite程序放松MaxCut问题有关。使用原始双功率条件,我们绑定了原始和双解决方案的条目和等级。此外,我们在轻微的技术假设下绑定了最佳目标值并证明了略微修改模型的概率估计的渐近一致性。我们对合成RDPG的实验不仅恢复了自然集群,而且还揭示了原始数据的下面的低维几何形状。我们还证明该方法在空手道俱乐部图表和合成美国参议图中恢复潜在结构,并且可以扩展到最多几百个节点的图表。
translated by 谷歌翻译
最近已扩展了最小方形聚类(MSSC)或K-均值类型聚类的最小总和,以利用每个群集的基数的先验知识。这种知识用于提高性能以及解决方案质量。在本文中,我们提出了一种基于分支和切割技术的精确方法,以解决基数受限的MSSC。对于下边界的例程,我们使用Rujeerapaiboon等人最近提出的半决赛编程(SDP)放松。 [Siam J. Optim。 29(2),1211-1239,(2019)]。但是,这种放松只能用于小型实例中的分支和切割方法。因此,我们得出了一种新的SDP松弛,该松弛随着实例大小和簇的数量更好。在这两种情况下,我们都通过添加多面体切割来增强结合。从量身定制的分支策略中受益,该策略会实施成对的约束,我们减少了儿童节点中出现的问题的复杂性。相反,对于上限,我们提出了一个本地搜索过程,该过程利用在每个节点上求解的SDP松弛的解。计算结果表明,所提出的算法在全球范围内首次求解了大小的现实实例,比通过最新精确方法求解的算法大10倍。
translated by 谷歌翻译
人工神经网络(ANN)训练景观的非凸起带来了固有的优化困难。虽然传统的背传播随机梯度下降(SGD)算法及其变体在某些情况下是有效的,但它们可以陷入杂散的局部最小值,并且对初始化和普通公共表敏感。最近的工作表明,随着Relu激活的ANN的培训可以重新重整为凸面计划,使希望能够全局优化可解释的ANN。然而,天真地解决凸训练制剂具有指数复杂性,甚至近似启发式需要立方时间。在这项工作中,我们描述了这种近似的质量,并开发了两个有效的算法,这些算法通过全球收敛保证培训。第一算法基于乘法器(ADMM)的交替方向方法。它解决了精确的凸形配方和近似对应物。实现线性全局收敛,并且初始几次迭代通常会产生具有高预测精度的解决方案。求解近似配方时,每次迭代时间复杂度是二次的。基于“采样凸面”理论的第二种算法更简单地实现。它解决了不受约束的凸形制剂,并收敛到大约全球最佳的分类器。当考虑对抗性培训时,ANN训练景观的非凸起加剧了。我们将稳健的凸优化理论应用于凸训练,开发凸起的凸起制剂,培训Anns对抗对抗投入。我们的分析明确地关注一个隐藏层完全连接的ANN,但可以扩展到更复杂的体系结构。
translated by 谷歌翻译