The performances of braking control systems for robotic platforms, e.g., assisted and autonomous vehicles, airplanes and drones, are deeply influenced by the road-tire friction experienced during the maneuver. Therefore, the availability of accurate estimation algorithms is of major importance in the development of advanced control schemes. The focus of this paper is on the estimation problem. In particular, a novel estimation algorithm is proposed, based on a multi-layer neural network. The training is based on a synthetic data set, derived from a widely used friction model. The open loop performances of the proposed algorithm are evaluated in a number of simulated scenarios. Moreover, different control schemes are used to test the closed loop scenario, where the estimated optimal slip is used as the set-point. The experimental results and the comparison with a model based baseline show that the proposed approach can provide an effective best slip estimation.
translated by 谷歌翻译
本文介绍了一种用于自主车辆的耦合,神经网络辅助纵向巡航和横向路径跟踪控制器,具有模型不确定性和经历未知的外部干扰。使用反馈误差学习机制,采用利用自适应径向基函数(RBF)神经网络的反向车辆动态学习方案,称为扩展的最小资源分配网络(EMRAN)。 EMRAN使用扩展的卡尔曼滤波器进行在线学习和体重更新,并采用了一种越来越多的/修剪策略,用于维护紧凑的网络,以便更容易地实现。在线学习算法处理参数化不确定性,并消除了未知干扰在道路上的影响。结合用于提高泛化性能的自我调节学习方案,所提出的EMRAN辅助控制架构辅助基本PID巡航和斯坦利路径跟踪控制器以耦合的形式。与传统的PID和斯坦利控制器相比,其对各种干扰和不确定性的性能和鲁棒性以及与基于模糊的PID控制器和主动扰动抑制控制(ADRC)方案的比较。慢速和高速场景介绍了仿真结果。根均线(RMS)和最大跟踪误差清楚地表明提出的控制方案在未知环境下实现自动车辆中更好的跟踪性能的有效性。
translated by 谷歌翻译
已经使用基于物理学的模型对非全面车辆运动进行了广泛的研究。使用这些模型时,使用线性轮胎模型来解释车轮/接地相互作用时的通用方法,因此可能无法完全捕获各种环境下的非线性和复杂动力学。另一方面,神经网络模型已在该域中广泛使用,证明了功能强大的近似功能。但是,这些黑盒学习策略完全放弃了现有的知名物理知识。在本文中,我们无缝将深度学习与完全不同的物理模型相结合,以赋予神经网络具有可用的先验知识。所提出的模型比大边距的香草神经网络模型显示出更好的概括性能。我们还表明,我们的模型的潜在特征可以准确地表示侧向轮胎力,而无需进行任何其他训练。最后,我们使用从潜在特征得出的本体感受信息开发了一种风险感知的模型预测控制器。我们在未知摩擦下的两个自动驾驶任务中验证了我们的想法,表现优于基线控制框架。
translated by 谷歌翻译
在机电一体化的IEEE / ASME交易上发布,DOI:10.1109 / TMECH.2021.3100150。理想情况下,需要精确的传感器测量来实现机电系统的闭环控制中的良好性能。因此,传感器故障将阻止系统正常工作,除非采用容错控制(FTC)架构。作为非线性系统的基于模型的FTC算法通常是具有挑战性的设计,本文基于深度学习的传感器故障存在于FTC的新方法。所考虑的方法用单个反复性神经网络替换故障检测和隔离和控制器设计的阶段,其在给定的时间窗口中具有过去的传感器测量值作为输入,以及控制变量的当前值作为输出。该端到端的深FTC方法应用于由球形倒立摆的机电调整系统,其构造通过反应轮改变,又通过电动机致动。模拟和实验结果表明,该方法可以处理连杆位置/速度传感器中发生的突然故障。提供的补充材料包括现实世界实验和软件源代码的视频。
translated by 谷歌翻译
这里,我们提出了一种新方法,在没有任何额外的平滑算法的模型预测路径积分控制(MPPI)任务中产生平滑控制序列。我们的方法有效地减轻了抽样中的喋喋不休,而MPPI的信息定位仍然是相同的。我们展示了具有不同算法的定量评估的挑战性自主驾驶任务中的提出方法。还提出了一种用于估算不同道路摩擦条件下的系统动态的神经网络车辆模型。我们的视频可以找到:\ url {https://youtu.be/o3nmi0ujfqg}。
translated by 谷歌翻译
本文提出了一种校准控制参数的方法。这种控制参数的示例是PID控制器的增益,优化控制的成本函数的权重,过滤器系数,滑动模式控制器的滑动表面,或神经网络的权重。因此,所提出的方法可以应用于各种控制器。该方法使用闭环系统操作数据来估计控制参数而不是系统状态的卡尔曼滤波器。控制参数校准由训练目标驱动,其包括对动态系统性能的规范。校准方法在线和强大地调整参数,是计算效率,具有低数据存储要求,并且易于实现对许多实时应用的吸引力。仿真结果表明,该方法能够快速学习控制参数(闭环成本的平均衰减因子大约24%),能够调整参数来补偿干扰(跟踪精度的提高约29%),并且是坚固的噪音。此外,具有高保真车辆模拟器Carim的仿真研究表明,该方法可以在线校准复杂动态系统的控制器,这表明其对现实世界的适用性。
translated by 谷歌翻译
能够与环境进行物理相互作用的新型航空车的最新发展导致了新的应用,例如基于接触的检查。这些任务要求机器人系统将力与部分知名的环境交换,这可能包含不确定性,包括未知的空间变化摩擦特性和表面几何形状的不连续变化。找到对这些环境不确定性的强大控制策略仍然是一个公开挑战。本文提出了一种基于学习的自适应控制策略,用于航空滑动任务。特别是,基于当前控制信号,本体感受测量和触觉感应的策略,实时调整了标准阻抗控制器的收益。在学生教师学习设置中,该策略通过简化执行器动力进行了模拟培训。使用倾斜臂全向飞行器验证了所提出方法的现实性能。所提出的控制器结构结合了数据驱动和基于模型的控制方法,使我们的方法能够直接转移并不从模拟转移到真实平台。与微调状态的相互作用控制方法相比,我们达到了减少的跟踪误差和改善的干扰排斥反应。
translated by 谷歌翻译
本文提出了一项新颖的控制法,以使用尾随机翼无人驾驶飞机(UAV)进行准确跟踪敏捷轨迹,该轨道在垂直起飞和降落(VTOL)和向前飞行之间过渡。全球控制配方可以在整个飞行信封中进行操作,包括与Sideslip的不协调的飞行。显示了具有简化空气动力学模型的非线性尾尾动力学的差异平坦度。使用扁平度变换,提出的控制器结合了位置参考的跟踪及其导数速度,加速度和混蛋以及偏航参考和偏航速率。通过角速度进纸术语包含混蛋和偏航率参考,可以改善随着快速变化的加速度跟踪轨迹。控制器不取决于广泛的空气动力学建模,而是使用增量非线性动态反演(INDI)仅基于局部输入输出关系来计算控制更新,从而导致对简化空气动力学方程中差异的稳健性。非线性输入输出关系的精确反转是通过派生的平坦变换实现的。在飞行测试中对所得的控制算法进行了广泛的评估,在该测试中,它展示了准确的轨迹跟踪和挑战性敏捷操作,例如侧向飞行和转弯时的侵略性过渡。
translated by 谷歌翻译
线性卡尔曼过滤器通常用于车辆跟踪。该过滤器需要了解车辆轨迹以及系统的统计数据和测量模型。在现实生活中,确定这些模型时做出的先前假设不存在。结果,总体过滤器性能降低,在某些情况下,估计的状态分歧。为了克服{车辆运动学}轨迹建模的不确定性,可以使用其他人工过程噪声或可以使用不同类型的自适应过滤器。本文提出了基于{Model和}机器学习算法的自适应Kalman滤波器。首先,使用复发性神经网络来学习车辆的几何和运动学特征。反过来,这些功能被插入监督的学习模型,从而提供了在Kalman框架中使用的实际过程噪声协方差。使用牛津机器人数据集评估了所提出的方法并将其与其他六个自适应过滤器进行了比较。提出的框架可以在其他估计问题中实现,以准确确定实时场景中的过程噪声协方差。
translated by 谷歌翻译
准确地建模四极管的系统动力学对于保证敏捷,安全和稳定的导航至关重要。该模型需要在多个飞行机制和操作条件下捕获系统行为,包括产生高度非线性效应的那些,例如空气动力和扭矩,转子相互作用或可能的系统配置修改。经典方法依靠手工制作的模型并努力概括和扩展以捕获这些效果。在本文中,我们介绍了一种新型的物理启发的时间卷积网络(PI-TCN)方法,用于学习四极管的系统动力学,纯粹是从机器人体验中学习的。我们的方法结合了稀疏时间卷积的表达力和密集的进料连接,以进行准确的系统预测。此外,物理限制嵌入了培训过程中,以促进网络对培训分布以外数据的概括功能。最后,我们设计了一种模型预测控制方法,该方法结合了学习的动力学,以完全利用学习范围的方式,以完全利用学习模型预测的准确闭环轨迹跟踪。实验结果表明,我们的方法可以准确地从数据中提取四四光动力学的结构,从而捕获对经典方法隐藏的效果。据我们所知,这是物理启发的深度学习成功地应用于时间卷积网络和系统识别任务,同时同时实现了预测性控制。
translated by 谷歌翻译
估计和对外部干扰的反应对于二次驾驶的稳健飞行控制至关重要。现有的估计器通常需要针对特定​​的飞行方案或具有大量现实世界数据的培训进行重大调整,以实现令人满意的性能。在本文中,我们提出了一个神经移动范围估计器(Neuromhe),该估计量可以自动调整由神经网络建模并适应不同飞行方案的MHE参数。我们通过将MHE估计值的分析梯度推导出相对于可调参数的分析梯度实现这一目标,从而使MHE无缝嵌入作为神经网络中的无缝嵌入以进行高效学习。最有趣的是,我们证明可以从递归形式的卡尔曼过滤器有效地解决梯度。此外,我们开发了一种基于模型的策略梯度算法,可以直接从轨迹跟踪误差中训练神经元,而无需进行基础真相干扰。通过在各种具有挑战性的飞行中对四摩特的模拟和物理实验,通过模拟和物理实验对神经元的有效性进行了广泛的验证。值得注意的是,NeuroMhe的表现优于最先进的估计器,仅使用2.5%的参数量,力估计误差降低了49.4%。所提出的方法是一般的,可以应用于其他机器人系统的稳健自适应控制。
translated by 谷歌翻译
我们描述了更改 - 联系机器人操作任务的框架,要求机器人与对象和表面打破触点。这种任务的不连续交互动态使得难以构建和使用单个动力学模型或控制策略,并且接触变化期间动态的高度非线性性质可能对机器人和物体造成损害。我们提出了一种自适应控制框架,使机器人能够逐步学习以预测更改联系人任务中的接触变化,从而了解了碎片连续系统的交互动态,并使用任务空间可变阻抗控制器提供平滑且精确的轨迹跟踪。我们通过实验比较我们框架的表现,以确定所需的代表性控制方法,以确定我们框架的自适应控制和增量学习组件需要在变化 - 联系机器人操纵任务中存在不连续动态的平稳控制。
translated by 谷歌翻译
神经网络已越来越多地用于模型预测控制器(MPC)来控制非线性动态系统。但是,MPC仍然提出一个问题,即可实现的更新率不足以应对模型不确定性和外部干扰。在本文中,我们提出了一种新颖的控制方案,该方案可以使用MPC的神经网络动力学设计最佳的跟踪控制器,从而使任何现有基于模型的Feedforward Controller的插件扩展程序都可以应用于插件。我们还描述了我们的方法如何处理包含历史信息的神经网络,该信息不遵循一般的动态形式。该方法通过其在外部干扰的经典控制基准中的性能进行评估。我们还扩展了控制框架,以应用于具有未知摩擦的积极自主驾驶任务。在所有实验中,我们的方法的表现都优于比较的方法。我们的控制器还显示出低控制的水平,表明我们的反馈控制器不会干扰MPC的最佳命令。
translated by 谷歌翻译
在本文中,我们分析了具有基于视觉导航的无人机(UAV)的时间延迟动力学对控制器设计的影响。时间延迟是网络物理系统中不可避免的现象,并且对无人机的控制器设计和轨迹产生具有重要意义。时间延迟对无人机动态的影响随着基于视力较慢的导航堆栈的使用而增加。我们表明,文献中的现有模型不包括时间延迟,不适合控制器调整,因为一个微不足道的解决方案始终存在错误的解决方案。我们确定的微不足道的解决方案表明,使用无限控制器的利益来实现最佳性能,这与实际发现相矛盾。我们通过引入无人机的新型非线性时间延迟模型来避免这种缺点,然后获得与每个UAV控制回路相对应的一组线性解耦模型。分析了角度和高度动力学的线性时间延迟模型的成本函数,与无延迟模型相反,我们显示了有限的最佳控制器参数的存在。由于使用了时间延迟模型,我们在实验上表明,所提出的模型准确地表示系统稳定性限制。由于时间延迟的考虑,我们使用基于视觉探视的无人机(VO)导航,在跟踪峰值速度为2.09 m/s的lemsistate轨迹时,我们实现了RMSE 5.01 cm的跟踪结果,这与最新-艺术。
translated by 谷歌翻译
由于这些要求的竞争性质,尤其是在一系列的运行速度和条件下,在转向控制中的准确性和误差融合与优美运动的平衡路径与优美的运动具有挑战性。本文表明,考虑滑移对运动学控制,动态控制和转向执行器速率命令的影响的集成多层转向控制器可实现准确且优美的路径。这项工作建立在多层侧滑和基于YAW的模型上,该模型允许派生控制器考虑由于侧滑而引起的误差以及转向命令和优美的侧向运动之间的映射。基于观察者的侧滑估计与运动控制器中的标题误差相结合,以提供前馈滑移补偿。使用基于速度的路径歧管,通过连续变量结构控制器(VSC)来补偿路径以下误差,以平衡优雅的运动和误差收敛。后台动态控制器使用结果偏航率命令来生成转向率命令。高增益观察者(HGO)估计输出反馈控制的侧滑和偏航率。提供了输出反馈控制器的稳定性分析,并解决了峰值。该工作仅针对侧向控制,因此转向控制器可以与其他速度控制器结合使用。现场结果提供了与相关方法的比较,这些方法在不同的复杂情况下证明了具有不同天气条件和扰动的不同复杂情况。
translated by 谷歌翻译
由于非线性动力学,执行器约束和耦合的纵向和横向运动,部分地,固定翼无人驾驶飞行器(无人机)的姿态控制是一个困难的控制问题。目前的最先进的自动驾驶仪基于线性控制,因此有限于其有效性和性能。深度加强学习(DRL)是一种通过与受控系统的交互自动发现最佳控制法的机器学习方法,可以处理复杂的非线性动态。我们在本文中展示DRL可以成功学习直接在原始非线性动态上运行的固定翼UAV的态度控制,需要短至三分钟的飞行数据。我们最初在仿真环境中培训我们的模型,然后在飞行测试中部署无人机的学习控制器,向最先进的ArduplaneProportional-Integry-artivation(PID)姿态控制器的表现展示了可比的性能,而无需进一步的在线学习。为了更好地理解学习控制器的操作,我们呈现了对其行为的分析,包括与现有良好调整的PID控制器的比较。
translated by 谷歌翻译
Legged robots pose one of the greatest challenges in robotics. Dynamic and agile maneuvers of animals cannot be imitated by existing methods that are crafted by humans. A compelling alternative is reinforcement learning, which requires minimal craftsmanship and promotes the natural evolution of a control policy. However, so far, reinforcement learning research for legged robots is mainly limited to simulation, and only few and comparably simple examples have been deployed on real systems. The primary reason is that training with real robots, particularly with dynamically balancing systems, is complicated and expensive. In the present work, we report a new method for training a neural network policy in simulation and transferring it to a state-of-the-art legged system, thereby we leverage fast, automated, and cost-effective data generation schemes. The approach is applied to the ANYmal robot, a sophisticated medium-dog-sized quadrupedal system. Using policies trained in simulation, the quadrupedal machine achieves locomotion skills that go beyond what had been achieved with prior methods: ANYmal is capable of precisely and energy-efficiently following high-level body velocity commands, running faster than ever before, and recovering from falling even in complex configurations.
translated by 谷歌翻译
惯性导航系统与全球导航卫星系统之间的融合经常用于许多平台,例如无人机,陆地车辆和船舶船只。融合通常是在基于模型的扩展卡尔曼过滤框架中进行的。过滤器的关键参数之一是过程噪声协方差。它负责实时解决方案的准确性,因为它考虑了车辆动力学不确定性和惯性传感器质量。在大多数情况下,过程噪声被认为是恒定的。然而,由于整个轨迹的车辆动力学和传感器测量变化,过程噪声协方差可能会发生变化。为了应对这种情况,文献中建议了几种基于自适应的Kalman过滤器。在本文中,我们提出了一个混合模型和基于学习的自适应导航过滤器。我们依靠基于模型的Kalman滤波器和设计深神网络模型来调整瞬时系统噪声协方差矩阵,仅基于惯性传感器读数。一旦学习了过程噪声协方差,就可以将其插入建立的基于模型的Kalman滤波器中。在推导了提出的混合框架后,提出了使用四极管的现场实验结果,并给出了与基于模型的自适应方法进行比较。我们表明,所提出的方法在位置误差中获得了25%的改善。此外,提出的混合学习方法可以在任何导航过滤器以及任何相关估计问题中使用。
translated by 谷歌翻译
从意外的外部扰动中恢复的能力是双模型运动的基本机动技能。有效的答复包括不仅可以恢复平衡并保持稳定性的能力,而且在平衡恢复物质不可行时,也可以保证安全的方式。对于与双式运动有关的机器人,例如人形机器人和辅助机器人设备,可帮助人类行走,设计能够提供这种稳定性和安全性的控制器可以防止机器人损坏或防止伤害相关的医疗费用。这是一个具有挑战性的任务,因为它涉及用触点产生高维,非线性和致动系统的高动态运动。尽管使用基于模型和优化方法的前进方面,但诸如广泛领域知识的要求,诸如较大的计算时间和有限的动态变化的鲁棒性仍然会使这个打开问题。在本文中,为了解决这些问题,我们开发基于学习的算法,能够为两种不同的机器人合成推送恢复控制政策:人形机器人和有助于双模型运动的辅助机器人设备。我们的工作可以分为两个密切相关的指示:1)学习人形机器人的安全下降和预防策略,2)使用机器人辅助装置学习人类的预防策略。为实现这一目标,我们介绍了一套深度加强学习(DRL)算法,以学习使用这些机器人时提高安全性的控制策略。
translated by 谷歌翻译
机器人社区在为软机器人设备建模提供的理论工具的复杂程度中看到了指数增长。已经提出了不同的解决方案以克服与软机器人建模相关的困难,通常利用其他科学学科,例如连续式机械和计算机图形。这些理论基础通常被认为是理所当然的,这导致复杂的文献,因此,从未得到完整审查的主题。Withing这种情况下,提交的文件的目标是双重的。突出显示涉及建模技术的不同系列的常见理论根源,采用统一语言,以简化其主要连接和差异的分析。因此,对上市接近自然如下,并最终提供在该领域的主要作品的完整,解开,审查。
translated by 谷歌翻译