模型预测控制是为机器人生成复杂动作的强大工具。但是,它通常需要在线解决非凸问题以产生丰富的行为,这在计算上很昂贵,并且并非总是实时实用的。此外,通过当前状态空间方法,反馈回路中高维传感器数据(例如RGB-D图像)的直接集成具有挑战性。本文旨在解决这两个问题。它引入了模型预测控制方案,其中神经网络不断根据感官输入来更新二次程序的成本函数,旨在最大程度地减少一般的非凸任务丢失而不解决非convex问题在线。通过更新成本,机器人可以直接从传感器测量中适应环境的变化,而无需进行新的成本设计。此外,由于可以通过硬限制有效地解决二次​​程序,因此可以确保机器人安全部署。在工业机器人操纵器上进行了各种涉及任务的实验表明,我们的方法可以有效地解决具有高维视觉感觉输入的复杂的非凸问题,同时仍然对外部干扰保持稳定。
translated by 谷歌翻译
本文提出了一种使用蒙特卡洛树搜索(MCT)来查找接触序列和有效的基于ADMM的轨迹优化算法的有效方法来进行对象操纵计划,以评估候选接触序列的动态可行性。为了加速MCT,我们提出了一种方法来学习一个目标条件的政策值网络,用于将搜索引导到有前途的节点。此外,操纵特定的启发式方法可以大大减少搜索空间。物理模拟器中的系统对象操纵实验证明了我们方法的效率。特别是,由于学识渊博的政策价值网络,我们的方法对长期操纵序列有利,从而大大提高了计划的成功率。
translated by 谷歌翻译
由于基本的非线性,混合和本质上不稳定的动力学,需要通过有限的接触力来稳定,因此为腿部机器人生成强大的轨迹仍然是一项具有挑战性的任务。此外,由于与环境和模型不匹配的未建模接触相互作用引起的干扰会阻碍计划轨迹的质量,从而导致不安全的运动。在这项工作中,我们建议使用随机轨迹优化来生成健壮的质心动量轨迹,以说明模型动力学和触点位置上的参数不确定性上的加法不确定性。通过强大的质心和全身轨迹优化之间的交替,我们生成了健壮的动量轨迹,同时与全身动力学保持一致。我们在四倍的机器人上执行了一组大量的模拟,这表明我们的随机轨迹优化问题减少了不同步态的脚部滑倒量,同时在确定性计划上实现了更好的性能。
translated by 谷歌翻译
最先进的腿机器人可以在其驱动系统的输出处测量扭矩,或者具有透明的驱动系统,从而能够从电动电流计算关节扭矩。无论哪种情况,这种传感器模式很少用于状态估计。在本文中,我们建议使用关节扭矩测量值来估计腿部机器人的质心状态。为此,我们将腿部机器人的全身动力学投射到接触约束的无空间中,从而使动力学的表达独立于接触力。使用受约束的动力学和质心动量矩阵,我们能够直接将关节扭矩和质心态动力学联系起来。使用结果模型作为扩展卡尔曼滤波器(EKF)的过程模型,我们将扭矩测量融合在质心状态估计问题中。通过在具有不同步态的四倍机器人上进行的实际实验,我们证明,与直接计算相比,基于扭矩的EKF的估计质心状态大大改善了这些数量的回收率。
translated by 谷歌翻译
由于机器人动力学中的固有非线性,腿部机器人全身动作的在线计划具有挑战性。在这项工作中,我们提出了一个非线性MPC框架,该框架可以通过有效利用机器人动力学结构来在线生成全身轨迹。Biconmp用于在真正的四倍机器人上生成各种环状步态,其性能在不同的地形上进行了评估,对抗不同步态之间的不可预见的推动力并在线过渡。此外,提出了双孔在机器人上产生非平凡无环的全身动态运动的能力。同样的方法也被用来在人体机器人(TALOS)上产生MPC的各种动态运动,并在模拟中产生另一个四倍的机器人(Anymal)。最后,报告并讨论了对计划范围和频率对非线性MPC框架的影响的广泛经验分析。
translated by 谷歌翻译
最佳控制是一种成功的方法,可以为复杂机器人产生运动,特别是对于有腿运动。然而,这些技术往往太慢而无法实时运行,以便模型预测控制或者需要大大简化动力学模型。在这项工作中,我们展示了一种学习来预测问题值函数的梯度和Hessian的方法,可以用一步二次程序来快速解决预测控制问题。此外,我们的方法能够满足像摩擦锥和单侧约束的约束,这对于高动态机器机器任务很重要。我们展示了我们在模拟中的方法和实际的四轮车机器人执行小跑和边界运动的能力。
translated by 谷歌翻译
由于捕获高角度和时间分辨率测量的能力,毫米波(MMWAVE)带引起了高精度定位应用的显着关注。本文探讨了基于MMWAVE的定位,用于目标本地化问题,其中固定目标广播MMWAVE信号和移动机器人代理尝试侦听信号以定位和导航到目标。提出了三个韵律过程:首先,移动代理使用张量分解方法来检测无线路径及其角度。其次,然后使用机器学习培训的分类器来预测链路状态,这意味着如果最强的路径是视线(LOS)或非LOS(NLO)。对于NLOS案例,链路状态预测器还确定最强路径是否通过一个或多个反射到达。第三,基于链路状态,代理人遵循估计的角度或探索环境。该方法在补充有线跟踪的室内环境的大型数据集上进行了演示,以模拟无线传播。路径估计和链路状态分类也集成到最先进的神经同时定位和映射(SLAM)模块中,以增强相机和基于LIDAR的导航。结果表明,链路状态分类器可以成功地推广到培训集外的完全新环境。另外,具有无线路径估计和链路状态分类器的神经基模块为目标提供快速导航,接近了解目标位置的基线。
translated by 谷歌翻译
模型预测控制(MPC)表明了控制诸如腿机器人等复杂系统的巨大成功。然而,在关闭循环时,在每个控制周期解决的有限范围最佳控制问题(OCP)的性能和可行性不再保证。这是由于模型差异,低级控制器,不确定性和传感器噪声的影响。为了解决这些问题,我们提出了一种修改版本,该版本的标准MPC方法用于带有活力的腿运动(弱向不变性)保证。在这种方法中,代替向问题添加(保守)终端约束,我们建议使用投影到在每个控制周期的OCP中的可行性内核中投影的测量状态。此外,我们使用过去的实验数据来找到最佳成本重量,该重量测量性能,约束满足鲁棒性或稳定性(不变性)的组合。这些可解释的成本衡量了稳健性和性能之间的贸易。为此目的,我们使用贝叶斯优化(BO)系统地设计实验,有助于有效地收集数据以了解导致强大性能的成本函数。我们的模拟结果具有不同的现实干扰(即外部推动,未铭出的执行器动态和计算延迟)表明了我们为人形机器人创造了强大的控制器的方法的有效性。
translated by 谷歌翻译
Ensemble learning combines results from multiple machine learning models in order to provide a better and optimised predictive model with reduced bias, variance and improved predictions. However, in federated learning it is not feasible to apply centralised ensemble learning directly due to privacy concerns. Hence, a mechanism is required to combine results of local models to produce a global model. Most distributed consensus algorithms, such as Byzantine fault tolerance (BFT), do not normally perform well in such applications. This is because, in such methods predictions of some of the peers are disregarded, so a majority of peers can win without even considering other peers' decisions. Additionally, the confidence score of the result of each peer is not normally taken into account, although it is an important feature to consider for ensemble learning. Moreover, the problem of a tie event is often left un-addressed by methods such as BFT. To fill these research gaps, we propose PoSw (Proof of Swarm), a novel distributed consensus algorithm for ensemble learning in a federated setting, which was inspired by particle swarm based algorithms for solving optimisation problems. The proposed algorithm is theoretically proved to always converge in a relatively small number of steps and has mechanisms to resolve tie events while trying to achieve sub-optimum solutions. We experimentally validated the performance of the proposed algorithm using ECG classification as an example application in healthcare, showing that the ensemble learning model outperformed all local models and even the FL-based global model. To the best of our knowledge, the proposed algorithm is the first attempt to make consensus over the output results of distributed models trained using federated learning.
translated by 谷歌翻译
Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.
translated by 谷歌翻译