行为树起源于视频游戏,是一种控制NPC的方法,但此后在机器人学界获得了吸引力,它是描述执行任务的框架。Behaverify是一种从PY_TREE创建NUXMV模型的工具。对于标准化的复合节点,此过程是自动的,不需要其他用户输入。自动支持各种叶子节点,不需要其他用户输入,但是自定义的叶节点将需要其他用户输入才能正确建模。Behaverify可以提供一个模板以使其更轻松。Behaverify能够创建具有100多个节点的NUXMV模型,NUXMV能够直接和通过反例验证该模型上的各种非平凡LTL属性。该模型具有并行节点,选择器和序列节点。与基于BTCompiler的模型的比较表明,由Behaverify创建的模型表现更好。
translated by 谷歌翻译
行为树(BT)在机器人界变得越来越流行。BT工具非常适合决策应用程序,允许机器人执行复杂的行为,同时也可以向人类解释。验证使用的BT在安全性和可靠性要求方面已经很好地构建是必不可少的,尤其是对于在关键环境中运行的机器人。在这项工作中,我们建议对行为树的形式规范和一种证明已经使用过的树的不变性的方法,同时使最终用户的树木形式化的复杂性保持简单。允许在行为树的特定实例中测试行为树的特定实例,而无需了解更抽象的形式化级别。
translated by 谷歌翻译
行为树(BT)是一种在自主代理中(例如机器人或计算机游戏中的虚拟实体)之间在不同任务之间进行切换的方法。 BT是创建模块化和反应性的复杂系统的一种非常有效的方法。这些属性在许多应用中至关重要,这导致BT从计算机游戏编程到AI和机器人技术的许多分支。在本书中,我们将首先对BTS进行介绍,然后我们描述BTS与早期切换结构的关系,并且在许多情况下如何概括。然后,这些想法被用作一套高效且易于使用的设计原理的基础。安全性,鲁棒性和效率等属性对于自主系统很重要,我们描述了一套使用BTS的状态空间描述正式分析这些系统的工具。借助新的分析工具,我们可以对BTS如何推广早期方法的形式形式化。我们还显示了BTS在自动化计划和机器学习中的使用。最后,我们描述了一组扩展的工具,以捕获随机BT的行为,其中动作的结果由概率描述。这些工具可以计算成功概率和完成时间。
translated by 谷歌翻译
自主机器人结合了各种技能,形成越来越复杂的行为,称为任务。尽管这些技能通常以相对较低的抽象级别进行编程,但它们的协调是建筑分离的,并且经常以高级语言或框架表达。几十年来,州机器一直是首选的语言,但是最近,行为树的语言在机器人主义者中引起了人们的关注。行为树最初是为计算机游戏设计的,用于建模自主参与者,提供了基于树木的可扩展的使命表示,并受到支持支持模块化设计和代码的重复使用。但是,尽管使用了该语言的几种实现,但对现实世界中的用法和范围知之甚少。行为树提供的概念与传统语言(例如州机器)有何关系?应用程序中如何使用行为树和状态机概念?我们介绍了对行为树中关键语言概念的研究及其在现实世界机器人应用中的使用。我们识别行为树语言,并将其语义与机器人技术中最著名的行为建模语言进行比较。我们为使用这些语言的机器人应用程序挖掘开源存储库并分析此用法。我们发现两种行为建模语言在语言设计及其在开源项目中的用法之间的相似性方面,以满足机器人域的需求。我们为现实世界行为模型的数据集提供了贡献,希望激发社区使用和进一步开发这种语言,相关的工具和分析技术。
translated by 谷歌翻译
多机器人和多代理系统通过系统的局部行为集成在组中表现出集体(Swarm)智能。分享有关任务和环境知识的代理商可以提高个人和任务水平的绩效。但是,这很难实现,部分原因是缺乏用于在代理之间转移一部分知识(行为)的通用框架。本文提出了一个新的知识表示框架和一种称为KT-BT:通过行为树的知识转移的转移策略。 KT-BT框架遵循通过在线行为树框架进行查询反应加速机制,在该框架中,代理对未知条件进行广播查询,并使用条件性能控制子流量以适当的知识做出响应。我们嵌入了一种称为StringBT的新型语法结构,该结构编码知识,从而实现行为共享。从理论上讲,我们研究了KT-BT框架的特性,与异质系统相比,整个小组的高知识同质性具有高度知识的性质,而没有能力共享知识。我们在模拟的多机器人搜索和救援问题中广泛验证了我们的框架。结果表明,在各种情况下,成功传递知识转移并提高了群体绩效。我们进一步研究了机会和沟通范围对一组代理商中群体绩效,知识传播和功能异质性的影响,并提供有趣的见解。
translated by 谷歌翻译
任务(SOT)控件允许机器人同时实现根据错误空间中(在)平等约束方面提出的许多优先目标。由于这种方法在每个时间步长求解了一系列二次程序(QP),而无需考虑任何时间状态的演变,因此适用于处理局部干扰。但是,其限制在于处理需要非二次目标才能实现特定目标的情况,以及应对控制干扰的情况,需要在本地进行次优的行动。最近的作品通过利用有限状态机器(FSM)来解决这一缺点,以使机器人不会陷入本地最小值的方式组成任务。然而,反应性和模块化之间的内在折衷是FSM的表征使它们在动态环境中定义反应性行为不切实际。在这封信中,我们将SOT控制策略与行为树(BTS)相结合,该任务切换结构在反应性,模块化和可重复使用方面解决了FSM的某些局限性。 Franka Emika Panda 7-DOF操纵器的实验结果显示了我们框架的稳健性,该框架使机器人可以从SOT和BTS的反应性中受益。
translated by 谷歌翻译
行为树代表了将几个低级控制策略结合到高级任务切换策略中的分层和模块化方式。在不同策略之间的任务切换方面也可以看到混合动态系统,因此已经进行了行为树和混合动态系统之间的几个比较,而是仅在离散时间内进行间隔。缺乏正式的行为树连续时间制定。此外,已经进行了特定类行为树设计的收敛分析,但不是一般设计。在这封信中,我们提供了行为树的第一次连续时间制定,表明它们可以被视为不连续的动态系统(混合动态系统的子类),这使得存在于行为树的存在和唯一性结果,最后,提供足够的条件,在该系统下,这些系统将收敛到通用设计的状态空间的所需区域。通过这些结果,可以在设计行为树控制器时使用持续时间动态系统的大量结果。
translated by 谷歌翻译
在本文中,我们提供了一个实用的证明,即与有限状态机(FSM)相比,行为树(BT)中的模块化如何减少编程机器人任务的努力。近年来,代表控制自治药物的任务计划的方法已从标准FSM转移到BTS。与标准方法相比,文献中的许多作品都强调并证明了这种设计的好处,尤其是在模块化,反应性和人类可读性方面。但是,这些作品通常无法在实施这些政策以及修改它们所需的编程工作中提供切实的比较。这是许多机器人应用中的一个相关方面,在该方面,设计选择是由政策的鲁棒性和对其进行编程所需的时间来决定的。在这项工作中,我们通过评估修改它们的成本来比较向后链的BT和FSM的耐故障设计。我们通过在模拟环境中通过一组实验来验证分析,其中移动操纵器可以解决项目提取任务。
translated by 谷歌翻译
Explainable AI (XAI) has the potential to make a significant impact on building trust and improving the satisfaction of users who interact with an AI system for decision-making. There is an abundance of explanation techniques in literature to address this need. Recently, it has been shown that a user is likely to have multiple explanation needs that should be addressed by a constellation of explanation techniques which we refer to as an explanation strategy. This paper focuses on how users interact with an XAI system to fulfil these multiple explanation needs satisfied by an explanation strategy. For this purpose, the paper introduces the concept of an "explanation experience" - as episodes of user interactions captured by the XAI system when explaining the decisions made by its AI system. In this paper, we explore how to enable and capture explanation experiences through conversational interactions. We model the interactive explanation experience as a dialogue model. Specifically, Behaviour Trees (BT) are used to model conversational pathways and chatbot behaviours. A BT dialogue model is easily personalised by dynamically extending or modifying it to attend to different user needs and explanation strategies. An evaluation with a real-world use case shows that BTs have a number of properties that lend naturally to modelling and capturing explanation experiences; as compared to traditionally used state transition models.
translated by 谷歌翻译
Despite recent success in large language model (LLM) reasoning, LLMs still struggle with hierarchical multi-step reasoning like generating complex programs. In these cases, humans often start with a high-level algorithmic design and implement each part gradually. We introduce Parsel, a framework enabling automatic implementation and validation of complex algorithms with code LLMs, based on hierarchical function descriptions in natural language. Parsel can be used across domains requiring hierarchical reasoning, e.g. code synthesis, theorem proving, and robotic planning. We demonstrate Parsel's capabilities by using it to generate complex programs that cannot currently be automatically implemented from one description and backtranslating Python programs in the APPS dataset. Beyond modeling capabilities, Parsel allows problem-solving with high-level algorithmic designs, benefiting both students and professional programmers.
translated by 谷歌翻译
在现实世界应用中,推理不完整的知识,传感,时间概念和数字约束的能力至关重要。尽管几个AI计划者能够处理其中一些要求,但它们主要限于特定类型的约束问题。本文提出了一种新的计划方法,该方法将临时计划构建结合在时间计划框架中,提供考虑数字约束和不完整知识的解决方案。我们建议对计划域定义语言(PDDL)进行较小的扩展,以模型(i)不完整,(ii)通过未知命题进行操作的知识传感动作,以及(iii)非确定性感应效应的可能结果。我们还引入了一组新的计划域来评估我们的求解器,该求解器在各种问题上表现出良好的性能。
translated by 谷歌翻译
我们在HOL4互动定理证明书的顶部实施了自动战术证据Tacticeoe。Tactice从人类证据中学习,数学技术适用于每个证明情况。然后在蒙特卡罗树搜索算法中使用这种知识来探索有前途的策略级证明路径。在一个CPU上,时间限制为60秒,Tactictoe在Hol4的标准图书馆中证明了7164定理的66.4%,而自动调度的电子箴言解决了34.5%。通过结合Tactice和电子证明者的结果,成功率上升至69.0%。
translated by 谷歌翻译
Alphazero,Leela Chess Zero和Stockfish Nnue革新了计算机国际象棋。本书对此类引擎的技术内部工作进行了完整的介绍。该书分为四个主要章节 - 不包括第1章(简介)和第6章(结论):第2章引入神经网络,涵盖了所有用于构建深层网络的基本构建块,例如Alphazero使用的网络。内容包括感知器,后传播和梯度下降,分类,回归,多层感知器,矢量化技术,卷积网络,挤压网络,挤压和激发网络,完全连接的网络,批处理归一化和横向归一化和跨性线性单位,残留层,剩余层,过度效果和底漆。第3章介绍了用于国际象棋发动机以及Alphazero使用的经典搜索技术。内容包括minimax,alpha-beta搜索和蒙特卡洛树搜索。第4章展示了现代国际象棋发动机的设计。除了开创性的Alphago,Alphago Zero和Alphazero我们涵盖Leela Chess Zero,Fat Fritz,Fat Fritz 2以及有效更新的神经网络(NNUE)以及MAIA。第5章是关于实施微型α。 Shexapawn是国际象棋的简约版本,被用作为此的示例。 Minimax搜索可以解决六ap峰,并产生了监督学习的培训位置。然后,作为比较,实施了类似Alphazero的训练回路,其中通过自我游戏进行训练与强化学习结合在一起。最后,比较了类似α的培训和监督培训。
translated by 谷歌翻译
在AI研究中,合成动作计划通常使用了抽象地指定由于动作而导致的动作的描述性模型,并针对有效计算状态转换来定制。然而,执行计划的动作已经需要运行模型,其中使用丰富的计算控制结构和闭环在线决策来指定如何在非预定的执行上下文中执行动作,对事件作出反应并适应展开情况。整合行动和规划的审议演员通常需要将这两种模型一起使用 - 在尝试开发不同的型号时会导致问题,验证它们的一致性,并顺利交错和规划。作为替代方案,我们定义和实施综合作用和规划系统,其中规划和行为使用相同的操作模型。这些依赖于提供丰富的控制结构的分层任务导向的细化方法。称为反应作用发动机(RAE)的作用组件由众所周知的PRS系统启发。在每个决定步骤中,RAE可以从计划者获取建议,以获得关于效用功能的近乎最佳选择。随时计划使用像UPOM的UCT类似的蒙特卡罗树搜索程序,其推出是演员操作模型的模拟。我们还提供与RAE和UPOM一起使用的学习策略,从在线代理体验和/或模拟计划结果,从决策背景下映射到方法实例以及引导UPOM的启发式函数。我们展示了富豪朝向静态域的最佳方法的渐近融合,并在实验上展示了UPOM和学习策略显着提高了作用效率和鲁棒性。
translated by 谷歌翻译
Amoebot模型将主动的可编程物质抽象为简单的计算元素的集合,称为Amoebot,它们在本地交互以集体完成协调和运动任务。自2014年SPAA推出以来,越来越多的文献已经改编了其对各种问题的假设。但是,如果没有标准化的假设层次结构,则很难对Amoebot模型下的结果进行精确的系统比较。我们提出了规范的Amoebot模型,该模型是一个更新的形式化,可区分核心模型特征和假设变体系列。规范Amoebot模型解决的关键改进是并发。现有的许多文献隐含地假设Amoebot动作是孤立且可靠的,将分析降低到一个顺序设置,其中最多一次是Amoebot活跃的。但是,实际可编程系统是并发的。 Canonical Amoebot模型将所有Amoebot通信形式化为消息传递,利用并发执行的对抗激活模型。在这种颗粒状的时间处理下,我们采用两种互补方法来并发算法设计。我们首先在任何并发执行下建立一组足够的条件,以实现算法正确性,将并发控制直接嵌入算法设计中。然后,我们提出了一个并发控制框架,该框架使用锁来转换在顺序设置中终止的Amoebot算法,并满足某些约定在并发设置中表现出等效行为的算法中的某些约定。作为案例研究,我们使用简单的六边形形成算法证明了这两种方法。共同的Amoebot模型以及这些并发算法设计的互补方法设计开放的新方向,用于分布式计算可编程问题。
translated by 谷歌翻译
主动推断是建模大脑的最新框架,该框架解释了各种机制,例如习惯形成,多巴胺能排出和好奇心。最近,已经开发了基于蒙特卡洛树搜索的两个版本的分支时间活动推理(BTAI),以处理在计算所有可能的策略之前,直到时间范围的所有可能的策略时,都会发生指数(时空和时间)的复杂性类别。但是,这两个版本的BTAI仍然遭受指数复杂性类W.R.T的损失。在本文中,我们首先允许对几个观测值进行建模来解决此限制,每个观察都有其自己的可能性映射。同样,我们允许每个潜在状态都有自己的过渡映射。然后,推论算法利用了可能性和过渡映射的分解以加速后验计算。在DSPRITES环境上测试了这两个优化,其中DSPRITES数据集的元数据被用作模型的输入,而不是DSPRITES图像。在此任务上,$ btai_ {vmp} $(Champion等,2022b,a)能够在5.1秒内解决96.9 \%的任务,而$ btai_ {bf} $(Champion等,2021a)是能够在17.5秒内解决98.6 \%的任务。我们的新方法($ btai_ {3mf} $)通过仅在2.559秒内完整求解任务(100 \%),超过了其两个前任。最后,$ btai_ {3mf} $已在灵活且易于使用(Python)软件包中实现,我们开发了一个图形用户界面,以实现对模型信念,计划过程和行为的检查。
translated by 谷歌翻译
行为树(BTS)的发现影响了游戏中的人工智能(AI)领域,通过提供游戏设计人员可管理的非玩家字符(NPCS)逻辑的灵活性和自然表示。尽管如此,更好的压力更好的NPCS AI-Agents强迫手工BTS的复杂性变得勉强易于易于出错。另一方面,虽然许多刚刚推出的在线游戏遭受了玩家短缺,但具有广泛功能的AI的存在可能会增加球员保留。因此,为了处理上述挑战,最近的领域的趋势专注于​​自动创建AI-Agents:从深层和加固技术到组合(约束)优化和BTS演化的技术。在本文中,我们提出了一种新的半自动构建AI-AGENT的方法,通过在源和BT游戏玩法之间的发达的相似度量下调整和调整专家创建的BT来模仿和概括的人类游戏。为此,我们配制了混合离散 - 连续优化问题,其中BT的拓扑和功能变化在数值变量中反映,并构建了专用的杂化 - 成胸型。呈现方法的表现在实验上验证了原型实时策略游戏。进行实验确认了提出的方法的效率和观点,该方法将适用于商业比赛。
translated by 谷歌翻译
在动态和远程环境中,对自主系统的高级自治和鲁棒性的需求促使开发人员提出了新的软件体系结构。一种常见的架构样式是将机器人系统的功能总结为基本动作(称为技能)的功能,在该动作上,在该动作中实施了技能管理层以结构,测试和控制功能层。但是,当前可用的验证工具仅在不复制系统实际执行的模型上提供特定于任务的验证或验证,这使得难以确保其对意外事件的鲁棒性。为此,已经开发出一种工具,即Skinet,以将系统的基于技能的架构转换为Petri网络,以建模技能和资源的状态机器行为。 Petri NET允许使用模型检查,例如线性时间逻辑(LTL)或计算树逻辑(CTL),以供用户分析和验证系统的模型。
translated by 谷歌翻译
决策树学习是机器学习中广泛使用的方法,在需要简洁明了的模型的应用中受到青睐。传统上,启发式方法用于快速生产具有相当高准确性的模型。然而,一个普遍的批评是,从精度和大小方面,所产生的树可能不一定是数据的最佳表示。近年来,这激发了最佳分类树算法的发展,这些算法与执行一系列本地最佳决策的启发式方法相比,在全球范围内优化决策树。我们遵循这一工作线,并提供了一种基于动态编程和搜索的最佳分类树的新颖算法。我们的算法支持对树的深度和节点数量的约束。我们方法的成功归因于一系列专门技术,这些技术利用了分类树独有的属性。传统上,最佳分类树的算法受到了高运行时的困扰和有限的可伸缩性,但我们在一项详细的实验研究中表明,我们的方法仅使用最先进的时间所需的时间,并且可以处理数十个数据集的数据集在数千个实例中,提供了几个数量级的改进,并特别有助于实现最佳决策树的实现。
translated by 谷歌翻译
为了协助游戏开发人员制作游戏NPC,我们展示了EvolvingBehavior,这是一种新颖的工具,用于基因编程,以在不真实的引擎4中发展行为树4.在初步评估中,我们将演变的行为与我们的研究人员设计的手工制作的树木和随机的树木进行了比较 - 在3D生存游戏中种植的树木。我们发现,在这种情况下,EvolvingBehavior能够产生行为,以实现设计师的目标。最后,我们讨论了共同创造游戏AI设计工具的探索的含义和未来途径,以及行为树进化的挑战和困难。
translated by 谷歌翻译