智能论文笔记

Efficiently Learning Single-Arm Fling Motions to Smooth Garments

Lawrence Yunliang Chen , Huang Huang , Ellen Novoseller , Daniel Seita , Jeffrey Ichnowski , Michael Laskey , Richard Cheng , Thomas Kollar , Ken Goldberg

分类：机器人

2022-06-17

最近的工作表明，2臂“ Fling”运动对于服装平滑可能是有效的。我们考虑单臂弹性运动。与几乎不需要机器人轨迹参数调整的2臂fling运动不同，单臂fling运动对轨迹参数很敏感。我们考虑一个单一的6多机器人臂，该机器人臂学习跨越轨迹以实现高衣覆盖率。给定服装抓握点，机器人在物理实验中探索了不同的参数化fling轨迹。为了提高学习效率，我们提出了一种粗到精细的学习方法，该方法首先使用多军匪徒（MAB）框架有效地找到候选动作，然后通过连续优化方法来完善。此外，我们提出了基于Fling Fall结果不确定性的新颖培训和执行时间停止标准。与基线相比，我们表明所提出的方法显着加速学习。此外，由于通过自学人员收集的类似服装的先前经验，新服装的MAB学习时间最多减少了87％。我们评估了6种服装类型：毛巾，T恤，长袖衬衫，礼服，汗衫和牛仔裤。结果表明，使用先前的经验，机器人需要30分钟以下的时间才能为达到60-94％覆盖率的新型服装学习一项动作。

translated by 谷歌翻译

Planar Robot Casting with Real2Sim2Real Self-Supervised Learning

Vincent Lim , Huang Huang , Lawrence Yunliang Chen , Jonathan Wang , Jeffrey Ichnowski , Daniel Seita , Michael Laskey , Ken Goldberg

分类：机器人

2021-11-08

使用单个参数化动态动作操纵可变形物体对蝇钓，宽毯和播放洗牌板等任务非常有用。此类任务作为输入所需的最终状态并输出一个参数化的开环动态机器人动作，它向最终状态产生轨迹。这对于具有涉及摩擦力的复杂动态的长地平轨迹尤其具有挑战性。本文探讨了平面机器人铸造的任务（PRC）：其中握住电缆一端的机器人手腕的一个平面运动使另一端朝向所需的目标滑过平面。 PRC允许电缆达到机器人工作区以外的点，并在家庭，仓库和工厂中具有电缆管理的应用。为了有效地学习给定电缆的PRC策略，我们提出了Real2Sim2Real，一个自动收集物理轨迹示例的自我监督框架，以使用差分演进调谐动态模拟器的参数，生成许多模拟示例，然后使用加权学习策略模拟和物理数据的组合。我们使用三种模拟器，ISAAC健身房分段，ISAAC健身房 - 混合动力和Pybullet，两个功能近似器，高斯工艺和神经网络（NNS），以及具有不同刚度，扭转和摩擦的三个电缆。结果每条电缆的16个举出的测试目标表明，使用ISAAC健身房分段的NN PRC策略达到中位误差距离（电缆长度的百分比），范围为8％至14％，表现优于真实或仅培训的基线和政策。只有模拟的例子。 https://tinyurl.com/robotcast可以使用代码，数据和视频。

translated by 谷歌翻译

SpeedFolding: Learning Efficient Bimanual Folding of Garments

Yahav Avigal , Lars Berscheid , Tamim Asfour , Torsten Kröger , Ken Goldberg

分类：机器人 | 人工智能

2022-08-22

折叠服装可靠，有效地是由于服装的复杂动力学和高尺寸配置空间，在机器人操作中是一项漫长的挑战。一种直观的方法是最初在折叠之前将服装操纵到典型的平滑配置。在这项工作中，我们开发了一种可靠且高效的双人系统，将用户定义的指令视为折叠线，将最初弄皱的服装操纵为（1）平滑和（2）折叠配置。我们的主要贡献是一种新型的神经网络体系结构，能够预测成对的握把姿势，以参数化各种双人动作原始序列。在从4300次人类注销和自我监督的动作中学习后，机器人能够平均从120年代以下的随机初始配置折叠服装，成功率为93％。现实世界实验表明，该系统能够概括到不同颜色，形状和刚度的服装。虽然先前的工作每小时达到3-6倍（FPH），但SpeedFolding却达到30-40 FPH。

translated by 谷歌翻译

Autonomously Untangling Long Cables

Vainavi Viswanath , Kaushik Shivakumar , Justin Kerr , Brijen Thananjeyan , Ellen Novoseller , Jeffrey Ichnowski , Alejandro Escontrela , Michael Laskey , Joseph E. Gonzalez , Ken Goldberg

分类：机器人 | 人工智能

2022-07-16

电缆在许多环境中无处不在，但容易出现自我闭合和结，使它们难以感知和操纵。挑战通常会随着电缆长度而增加：长电缆需要更复杂的松弛管理和策略，以促进可观察性和可及性。在本文中，我们专注于使用双边机器人自动弄清长达3米的电缆。我们开发了新的运动原语，以有效地解开长电缆和专门用于此任务的新型Gripper Jaws。我们提出了缠结操作（SGTM）的滑动和抓握，该算法将这些原始物与RGBD视觉构成迭代性毫无障碍。SGTM在隔离的外手上取消了67％的成功率，图8节和更复杂的配置上的50％。可以在https://sites.google.com/view/rss-2022-untangling/home上找到补充材料，可视化和视频。

translated by 谷歌翻译

LEGS: Learning Efficient Grasp Sets for Exploratory Grasping

Letian Fu , Michael Danielczuk , Ashwin Balakrishna , Daniel S. Brown , Jeffrey Ichnowski , Eugen Solowjow , Ken Goldberg

分类：机器人

2021-11-29

以前的工作定义了探索性抓握，其中一个机器人迭代地抓住并丢弃一个未知的复杂多面体物体，以发现一组稳定的掌握对象的每个识别的不同稳定的姿势。最近的工作用来了一个多武装强盗模型，每种姿势一小组候选麦克风;但是，对于具有少数成功Grasps的物体，该组可能不包括最强大的掌握。我们展示了学习高效的掌握装置（腿），这是一种算法，可以通过构建大型有希望的掌握的小型活跃的掌握，并使用学习的信心范围来确定何时何时置信，它可以停止探索对象。实验表明，腿可以比不学习活动集的现有算法更有效地识别高质量的掌握。在仿真实验中，我们测量腿部和基线所识别的最佳掌握的成功概率与真正最强大的掌握的最佳差距。经过3000个探索步骤后，腿部优于14个Dex-Net对手的10个中的基线算法和39 egad的25个！对象。然后，我们开发一个自我监督的掌握系统，机器人探讨了人类干预最小的掌握。 3对象的物理实验表明，腿将从基线收敛到高性能的GRASPS比基线更快。有关补充材料和视频，请参阅\ url {https://sites.google.com/view/legs-exp-grasping}。

translated by 谷歌翻译

Learning Switching Criteria for Sim2Real Transfer of Robotic Fabric Manipulation Policies

Satvik Sharma , Ellen Novoseller , Vainavi Viswanath , Zaynah Javed , Rishi Parikh , Ryan Hoque , Ashwin Balakrishna , Daniel S. Brown , Ken Goldberg

分类：机器人

2022-07-02

模拟到现实的转移已成为一种流行且非常成功的方法，用于培训各种任务的机器人控制政策。但是，确定在模拟中训练的政策何时准备将其转移到物理世界通常是一个挑战。部署经过很少的模拟数据训练的策略可能会导致物理硬件的不可靠和危险行为。另一方面，模拟中的过度训练会导致策略过度拟合模拟器的视觉外观和动力学。在这项工作中，我们研究了自动确定在模拟中训练的策略何时可以可靠地转移到物理机器人的策略。我们在机器人织物操纵的背景下专门研究了这些思想，因为成功建模织物的动力学和视觉外观的困难，成功的SIM2Real转移尤其具有挑战性。导致织物平滑任务表明我们的切换标准与实际的性能很好地相关。特别是，我们基于信心的切换标准在培训总预算的55-60％之内达到了87.2-93.7％的平均最终面料覆盖率。有关代码和补充材料，请参见https://tinyurl.com/lsc-case。

translated by 谷歌翻译

Learning Fabric Manipulation in the Real World with Human Videos

Robert Lee , Jad Abou-Chakra , Fangyi Zhang , Peter Corke

分类：机器人 | 人工智能

2022-11-05

Fabric manipulation is a long-standing challenge in robotics due to the enormous state space and complex dynamics. Learning approaches stand out as promising for this domain as they allow us to learn behaviours directly from data. Most prior methods however rely heavily on simulation, which is still limited by the large sim-to-real gap of deformable objects or rely on large datasets. A promising alternative is to learn fabric manipulation directly from watching humans perform the task. In this work, we explore how demonstrations for fabric manipulation tasks can be collected directly by human hands, providing an extremely natural and fast data collection pipeline. Then, using only a handful of such demonstrations, we show how a sample-efficient pick-and-place policy can be learned and deployed on a real robot, without any robot data collection at all. We demonstrate our approach on a fabric folding task, showing that our policy can reliably reach folded states from crumpled initial configurations.

translated by 谷歌翻译

Learning to Localize, Grasp, and Hand Over Unmodified Surgical Needles

Albert Wilcox , Justin Kerr , Brijen Thananjeyan , Jeffrey Ichnowski , Minho Hwang , Samuel Paradis , Danyal Fer , Ken Goldberg

分类：机器人

2021-12-08

机器人外科助理（RSAs）通常用于通过专家外科医生进行微创手术。然而，长期以来充满了乏味和重复的任务，如缝合可以导致外科医生疲劳，激励缝合的自动化。随着薄反射针的视觉跟踪极具挑战性，在未反射对比涂料的情况下修改了针。作为朝向无修改针的缝合子任务自动化的步骤，我们提出了休斯顿：切换未经修改，外科手术，工具障碍针，一个问题和算法，它使用学习的主动传感策略与立体声相机本地化并对齐针头进入另一臂的可见和可访问的姿势。为了补偿机器人定位和针头感知误差，然后算法执行使用多个摄像机的高精度抓握运动。在使用Da Vinci研究套件（DVRK）的物理实验中，休斯顿成功通过了96.7％的成功率，并且能够在故障前平均地在臂32.4倍之间顺序地执行切换。在培训中看不见的针头，休斯顿实现了75-92.9％的成功率。据我们所知，这项工作是第一个研究未修改的手术针的切换。查看https://tinyurl.com/huston-surgery用于额外的材料。

translated by 谷歌翻译

Bodies Uncovered: Learning to Manipulate Real Blankets Around People via Physics Simulations

Kavya Puthuveetil , Charles C. Kemp , Zackory Erickson

分类：机器人

2021-09-10

虽然机器人提供了一个机会，为老年人和床上移动性损伤的人提供物理援助，但人们经常在床上休息，毯子覆盖着他们的大部分的毯子。为许多日常自我保健任务提供帮助，例如沐浴，敷料或守护，护理人员必须先从人体的一部分揭开毯子。在这项工作中，我们介绍了一个关于机器人床上用品操作的制定，其中一个机器人从目标身体部位揭开毯子，同时确保人体的其余部分仍然被覆盖。我们比较两种方法来优化提供具有掌握和释放点的机器人的策略，即揭示身体的目标部分：1）加强学习和2）通过优化来生成培训数据的自我监督学习。我们在物理模拟环境中培训并进行了评估，该政策包括覆盖床上模拟人类仰卧的可变形布网格。此外，我们还将模拟训练的政策转移到真正的移动操纵器，并证明它可以从躺在床上的人体模型的目标身体部位揭开毯子。源代码在线获取。

translated by 谷歌翻译

Fully Autonomous Real-World Reinforcement Learning with Applications to Mobile Manipulation

Charles Sun , Jędrzej Orbik , Coline Devin , Brian Yang , Abhishek Gupta , Glen Berseth , Sergey Levine

分类：机器学习 | 机器人

2021-07-28

我们研究机器人如何自主学习需要联合导航和抓握的技能。虽然原则上的加固学习提供自动机器人技能学习，但在实践中，在现实世界中的加固学习是挑战性的，并且往往需要大量的仪器和监督。我们的宗旨是以无论没有人为干预的自主方式，设计用于学习导航和操纵的机器人强化学习系统，在没有人为干预的情况下，在现实的假设下实现持续学习。我们建议的系统relmm，可以在没有任何环境仪器的现实世界平台上不断学习，没有人为干预，而无需访问特权信息，例如地图，对象位置或环境的全局视图。我们的方法采用模块化策略与组件进行操纵和导航，其中操纵政策不确定性驱动导航控制器的探索，操作模块为导航提供奖励。我们在房间清理任务上评估我们的方法，机器人必须导航到并拾取散落在地板上的物品。在掌握课程训练阶段之后，relmm可以在自动真实培训的大约40小时内自动学习导航并完全抓住。

translated by 谷歌翻译

An Architecture for Reactive Mobile Manipulation On-The-Move

Ben Burgess-Limerick , Chris Lehnert , Jurgen Leitner , Peter Corke

分类：机器人

2022-12-14

We present a generalised architecture for reactive mobile manipulation while a robot's base is in motion toward the next objective in a high-level task. By performing tasks on-the-move, overall cycle time is reduced compared to methods where the base pauses during manipulation. Reactive control of the manipulator enables grasping objects with unpredictable motion while improving robustness against perception errors, environmental disturbances, and inaccurate robot control compared to open-loop, trajectory-based planning approaches. We present an example implementation of the architecture and investigate the performance on a series of pick and place tasks with both static and dynamic objects and compare the performance to baseline methods. Our method demonstrated a real-world success rate of over 99%, failing in only a single trial from 120 attempts with a physical robot system. The architecture is further demonstrated on other mobile manipulator platforms in simulation. Our approach reduces task time by up to 48%, while also improving reliability, gracefulness, and predictability compared to existing architectures for mobile manipulation. See https://benburgesslimerick.github.io/ManipulationOnTheMove for supplementary materials.

translated by 谷歌翻译

Mesh-based Dynamics with Occlusion Reasoning for Cloth Manipulation

Zixuan Huang , Xingyu Lin , David Held

分类：机器人 | 计算机视觉

2022-06-06

自我咬合对于布料操纵而具有挑战性，因为这使得很难估计布的全部状态。理想情况下，试图展开弄皱或折叠的布的机器人应该能够对布的遮挡区域进行推理。我们利用姿势估计的最新进展来构建一种使用明确的遮挡推理来展开皱巴布的系统的系统。具体来说，我们首先学习一个模型来重建布的网格。但是，由于布构型的复杂性以及遮挡的歧义，该模型可能会出现错误。我们的主要见解是，我们可以通过进行自我监督的损失进行测试时间填充来进一步完善预测的重建。获得的重建网格使我们能够在推理遮挡的同时使用基于网格的动力学模型来计划。我们在布料上和布料规范化上评估了系统，其目的是将布操作成典型的姿势。我们的实验表明，我们的方法显着优于未明确解释闭塞或执行测试时间优化的先验方法。可以在我们的$ \ href {https://sites.google.com/view/occlusion-reason/home/home} {\ text {project {project {project}}}上找到视频和可视化。

translated by 谷歌翻译

Learning to Singulate Layers of Cloth using Tactile Feedback

Sashank Tirumala , Thomas Weng , Daniel Seita , Oliver Kroemer , Zeynep Temel , David Held

分类：机器人

2022-07-22

布料的机器人操作的应用包括织物制造业到处理毯子和洗衣。布料操作对于机器人而言是挑战，这主要是由于它们的高度自由度，复杂的动力学和折叠或皱巴巴配置时的严重自我闭合。机器人操作的先前工作主要依赖于视觉传感器，这可能会对细粒度的操纵任务构成挑战，例如从一堆布上抓住所需数量的布料层。在本文中，我们建议将触觉传感用于布操作；我们将触觉传感器（Resin）连接到弗兰卡机器人的两个指尖之一，并训练分类器，以确定机器人是否正在抓住特定数量的布料层。在测试时间实验中，机器人使用此分类器作为其政策的一部分，使用触觉反馈来掌握一两个布层，以确定合适的握把。实验结果超过180次物理试验表明，与使用图像分类器的方法相比，所提出的方法优于不使用触觉反馈并具有更好地看不见布的基准。代码，数据和视频可在https://sites.google.com/view/reskin-cloth上找到。

translated by 谷歌翻译

Learning Robotic Manipulation Tasks via Task Progress based Gaussian Reward and Loss Adjusted Exploration

Sulabh Kumra , Shirin Josh , Ferat Sahin

分类：机器人

2021-03-02

非结构化环境中的多步操纵任务对于学习的机器人来说非常具有挑战性。这些任务相互作用，包括可以获得的预期状态，可以实现整体任务和低级推理，以确定哪些行动将产生这些国家。我们提出了一种无模型的深度加强学习方法来学习多步理操作任务。我们介绍了一个基于视觉的模型架构的机器人操纵网络（ROMANNET），以了解动作值函数并预测操纵操作候选。我们定义基于Gaussian（TPG）奖励函数的任务进度，基于导致成功的动作原语的行动和实现整体任务目标的进展来计算奖励。为了平衡探索/剥削的比率，我们介绍了一个损失调整后的探索（LAE）政策，根据亏损估计的Boltzmann分配来确定来自行动候选人的行动。我们通过培训ROMANNET来展示我们方法的有效性，以了解模拟和现实世界中的几个挑战的多步机械管理任务。实验结果表明，我们的方法优于现有的方法，并在成功率和行动效率方面实现了最先进的性能。消融研究表明，TPG和LAE对多个块堆叠的任务特别有益。代码可用：https：//github.com/skumra/romannet

translated by 谷歌翻译

Learning Control Policies for Fall prevention and safety in bipedal locomotion

Visak Kumar

分类：机器人 | 人工智能

2022-01-04

从意外的外部扰动中恢复的能力是双模型运动的基本机动技能。有效的答复包括不仅可以恢复平衡并保持稳定性的能力，而且在平衡恢复物质不可行时，也可以保证安全的方式。对于与双式运动有关的机器人，例如人形机器人和辅助机器人设备，可帮助人类行走，设计能够提供这种稳定性和安全性的控制器可以防止机器人损坏或防止伤害相关的医疗费用。这是一个具有挑战性的任务，因为它涉及用触点产生高维，非线性和致动系统的高动态运动。尽管使用基于模型和优化方法的前进方面，但诸如广泛领域知识的要求，诸如较大的计算时间和有限的动态变化的鲁棒性仍然会使这个打开问题。在本文中，为了解决这些问题，我们开发基于学习的算法，能够为两种不同的机器人合成推送恢复控制政策：人形机器人和有助于双模型运动的辅助机器人设备。我们的工作可以分为两个密切相关的指示：1）学习人形机器人的安全下降和预防策略，2）使用机器人辅助装置学习人类的预防策略。为实现这一目标，我们介绍了一套深度加强学习（DRL）算法，以学习使用这些机器人时提高安全性的控制策略。

translated by 谷歌翻译

FlowBot3D: Learning 3D Articulation Flow to Manipulate Articulated Objects

Ben Eisner , Harry Zhang , David Held

分类：机器人 | 人工智能 | 计算机视觉

2022-05-09

我们探索一种新的方法来感知和操纵3D铰接式物体，该物体可以概括地使机器人阐明看不见的对象。我们提出了一个基于视觉的系统，该系统学会预测各种铰接物体的各个部分的潜在运动，以指导系统的下游运动计划以表达对象。为了预测对象运动，我们训练一个神经网络，以输出一个密集的向量场，代表点云中点云中点的点运动方向。然后，我们根据该向量领域部署一个分析运动计划者，以实现产生最大发音的政策。我们完全在模拟中训练视觉系统，并演示了系统在模拟和现实世界中概括的对象实例和新颖类别的能力，并将我们的政策部署在没有任何填充的锯耶机器人上。结果表明，我们的系统在模拟和现实世界实验中都达到了最先进的性能。

translated by 谷歌翻译

SGTM 2.0: Autonomously Untangling Long Cables using Interactive Perception

Kaushik Shivakumar , Vainavi Viswanath , Anrui Gu , Yahav Avigal , Justin Kerr , Jeffrey Ichnowski , Richard Cheng , Thomas Kollar , Ken Goldberg

分类：机器人 | 人工智能 | 机器学习

2022-09-27

电缆在房屋，医院和工业仓库中很普遍，容易纠结。本文通过引入新颖的不确定性定量指标和与电缆相互作用以减少感知不确定性相互作用的新型不确定性定量指标和动作，扩展了对自动释放长电缆的先前工作。我们为Tangle操纵2.0（SGTM 2.0）提供了滑动和握力，该系统使用双边机器人自动解开大约3米长的电缆，并使用每个步骤的不确定性估算值估计，以告知动作。通过互动降低不确定性，缠结操作2.0（SGTM 2.0）的滑动和握住可以减少其必须采用的状态排列动作的数量，从而大大加快运行时间。实验表明，SGTM 2.0可以在1或2台上和图8节的电缆上取得83％的脱节成功，并且在这些配置中的70％终止检测成功，在无障碍精度上优于SGTM 1.0，超过43％，在全部推出速度上超过200％。可以在sites.google.com/view/sgtm2上找到补充材料，可视化和视频。

translated by 谷歌翻译

Visuotactile Affordances for Cloth Manipulation with Local Control

Neha Sunil , Shaoxiong Wang , Yu She , Edward Adelson , Alberto Rodriguez

分类：机器人 | 机器学习

2022-12-09

Cloth in the real world is often crumpled, self-occluded, or folded in on itself such that key regions, such as corners, are not directly graspable, making manipulation difficult. We propose a system that leverages visual and tactile perception to unfold the cloth via grasping and sliding on edges. By doing so, the robot is able to grasp two adjacent corners, enabling subsequent manipulation tasks like folding or hanging. As components of this system, we develop tactile perception networks that classify whether an edge is grasped and estimate the pose of the edge. We use the edge classification network to supervise a visuotactile edge grasp affordance network that can grasp edges with a 90% success rate. Once an edge is grasped, we demonstrate that the robot can slide along the cloth to the adjacent corner using tactile pose estimation/control in real time. See http://nehasunil.com/visuotactile/visuotactile.html for videos.

translated by 谷歌翻译

Deep Learning Approaches to Grasp Synthesis: A Review

Rhys Newbury , Morris Gu , Lachlan Chumbley , Arsalan Mousavian , Clemens Eppner , Jürgen Leitner , Jeannette Bohg , Antonio Morales , Tamim Asfour , Danica Kragic

分类：机器人

2022-07-06

抓握是通过在一组触点上施加力和扭矩来挑选对象的过程。深度学习方法的最新进展允许在机器人对象抓地力方面快速进步。我们在过去十年中系统地调查了出版物，特别感兴趣使用最终效果姿势的所有6度自由度抓住对象。我们的综述发现了四种用于机器人抓钩的常见方法：基于抽样的方法，直接回归，强化学习和示例方法。此外，我们发现了围绕抓握的两种“支持方法”，这些方法使用深入学习来支持抓握过程，形状近似和负担能力。我们已经将本系统评论（85篇论文）中发现的出版物提炼为十个关键要点，我们认为对未来的机器人抓握和操纵研究至关重要。该调查的在线版本可从https://rhys-newbury.github.io/projects/6dof/获得

translated by 谷歌翻译

FabricFlowNet: Bimanual Cloth Manipulation with a Flow-based Policy

Thomas Weng , Sujay Bajracharya , Yufei Wang , Khush Agrawal , David Held

分类：机器人 | 计算机视觉

2021-11-10

我们解决了目标定向布操纵问题，这是由于布的可变形性导致的具有挑战性的任务。我们的见解是，光流量，一种通常用于视频中运动估计的技术，还可以提供相应布在观察和目标图像上的相应布构成的有效表示。我们介绍了FabricFlowNet（FFN），布料操作策略，利用流量作为输入和作为提高性能的动作表示。 FabricFlownet也根据所需目标在Bimanual和单臂动作之间提供优雅的切换。我们表明，FabricFlownet明显优于拍摄图像输入的最先进的无模型和模型的布料操作策略。我们还在生效系统上呈现实际的实验，展示了有效的SIM-to-Real Transfer。最后，我们表明我们的方法在单个方形布上训练到其他布形时，如T恤和矩形布。视频和其他补充材料可用于：https://sites.google.com/view/fabricFlownet。

translated by 谷歌翻译