本文介绍了相关的弧定向问题(CAOP),其中的任务是找到机器人团队的路线,以最大程度地收集与环境中功能相关的奖励的收集。这些功能可以是一维或环境中的点,并且可以具有空间相关性,即访问环境中的功能可能会提供与相关功能相关的奖励的一部分。机器人在环境环境时会产生成本,并且路线的总成本受到资源限制(例如电池寿命或操作时间)的限制。由于环境通常很大,我们允许多个仓库在机器人必须启动和结束路线的地方。 CAOP概括了相关的定向问题(COP),其中奖励仅与点特征相关联以及ARC定向启动问题(AOP),其中奖励与无空间相关。我们制定了一个混合整数二次程序(MIQP),该程序正式化了问题并提供最佳的解决方案。但是,这个问题是NP-HARD,因此我们开发了一种有效的贪婪的建设性算法。我们用两种不同的应用说明了问题:甲烷气体泄漏检测和道路网络覆盖范围的信息路径计划。
translated by 谷歌翻译
线覆盖范围的问题是找到有效的路由,以通过一个或多个资源约束的机器人覆盖线性特征。线性具有模型环境,例如道路网络,电力线以及石油和天然气管道。我们为机器人定义了两种旅行模式:维修和陷入困境。机器人服务功能如果它执行特定于任务的操作,例如拍摄图像,则它可以遍历该功能;否则,它是无人机的。穿越环境会产生成本(例如旅行时间)和对资源的需求(例如电池寿命)。维修和无人机的成本和需求功能可能具有不同的成本和需求功能,我们进一步允许它们取决于方向。我们将环境建模为图形,并提供整数线性程序。由于问题是NP-HARD,因此我们开发了一种快速有效的启发式算法,即合并 - 默认混合物(MEM)。该算法的建设性属性使得为大图求解了多depot版本。我们进一步扩展了MEM算法,以处理转弯成本和非语言限制。我们在50个道路网络的数据集上对算法进行基准测试,并在道路网络上使用空中机器人进行了实验中的算法。
translated by 谷歌翻译
线覆盖范围是为环境中的一组一维功能提供服务的任务。这对于检查线性基础设施(例如道路网络,电力线以及石油和天然气管道)很重要。本文通过在图上将其建模为优化问题,解决了空中和地面机器人的单个机器人线覆盖率问题。该问题属于广泛的ARC路由问题,与不对称的农村邮政问题(RPP)密切相关。本文提供了一个整数线性编程公式,并提供了正确的证明。使用最低成本流问题,我们开发近似算法,并保证解决方案质量。这些保证还改善了不对称RPP的现有结果。主要算法将问题分为三种情况,以所需图的结构,即需要维修的特征诱导的图。我们在世界上50个人口最多的城市的道路网络上评估了我们的算法。该算法以改进的启发式增强,在3s内运行,并生成最佳最佳10%以内的解决方案。我们在UNC Charlotte校园路网络上通过商业无人机在实验中展示了我们的算法。
translated by 谷歌翻译
区域覆盖范围问题是使用安装在机器人(例如无人驾驶汽车(UAV)(UAV)和无人接地车辆(UGV)等机器人上的传感器有效维修给定的二维表面的任务。我们提出了一种新颖的配方,用于生成多个容量受限机器人的覆盖路线,可以根据电池寿命或飞行时间指定容量。遍历环境对具有容量限制的机器人资源产生了需求。我们方法的主要方面是将区域覆盖问题转换为线覆盖范围问题(即线性特征的覆盖范围),然后生成途径,以最大程度地减少旅行的总成本,同时尊重容量约束。我们定义了两种旅行模式:(1)维修和(2)无人机,这与机器人是否执行特定于任务的操作相对应。我们的配方允许对两种模式的单独和不对称的旅行成本和需求。此外,从细胞分解计算出来的细胞,旨在最小化转弯的数量,不需要单调多边形。我们为细胞分解和生成服务轨道开发了新的程序,这些过程可以处理有或没有孔的非符号酮多边形。我们在具有25个室内环境的地面机器人数据集和一个具有300个室外环境的空中机器人数据集上建立了算法的功效。该算法生成的解决方案的成本比最新方法平均低10%。我们还证明了我们在无人机实验中的算法。
translated by 谷歌翻译
我们研究了合作航空航天车辆路线应用程序的资源分配问题,其中多个无人驾驶汽车(UAV)电池容量有限和多个无人接地车辆(UGV),这也可以充当移动充电站,需要共同实现诸如持续监视一组要点之类的任务。由于无人机的电池能力有限,他们有时必须偏离任务才能与UGV进行集合并得到充电。每个UGV一次可以一次提供有限数量的无人机。与确定性多机器人计划的先前工作相反,我们考虑了无人机能源消耗的随机性所带来的挑战。我们有兴趣找到无人机的最佳充电时间表,从而最大程度地减少了旅行成本,并且在计划范围内没有任何无人机在计划范围内取消收费的可能性大于用户定义的公差。我们将此问题({风险意识召集集合问题(RRRP))}作为整数线性程序(ILP),其中匹配的约束捕获资源可用性约束,而背包约束捕获了成功概率约束。我们提出了一种求解RRRP的双晶格近似算法。在一个持续监测任务的背景下,我们证明了我们的制定和算法的有效性。
translated by 谷歌翻译
我们为多机器人任务计划和分配问题提出了一种新的公式,该公式结合了(a)任务之间的优先关系; (b)任务的协调,允许多个机器人提高效率; (c)通过形成机器人联盟的任务合作,而单独的机器人不能执行。在我们的公式中,任务图指定任务和任务之间的关系。我们在任务图的节点和边缘上定义了一组奖励函数。这些功能对机器人联盟规模对任务绩效的影响进行建模,并结合一个任务的性能对依赖任务的影响。最佳解决此问题是NP-HARD。但是,使用任务图公式使我们能够利用最小成本的网络流量方法有效地获得近似解决方案。此外,我们还探索了一种混合整数编程方法,该方法为问题的小实例提供了最佳的解决方案,但计算上很昂贵。我们还开发了一种贪婪的启发式算法作为基准。我们的建模和解决方案方法导致任务计划,即使在与许多代理商的大型任务中,也利用任务优先关系的关系以及机器人的协调和合作来实现高级任务绩效。
translated by 谷歌翻译
在本文中,我们研究了众所周知的团队导演问题,其中一批机器人通过访问地点收集奖励。通常,假设奖励是机器人已知的;但是,在环境监测或场景重建的应用中,奖励通常是主观的,并指定它们是具有挑战性的。我们提出了一个框架来通过向它们呈现替代解决方案来学习用户的未知偏好,并且用户在所提出的替代解决方案上提供排名。我们考虑了用户的两种情况:1)确定替代解决方案的最佳排名的确定性用户,以及根据未知概率分布提供最佳排名的噪声用户。对于确定性用户,我们提出了一个框架,以最大限度地减少与最佳解决方案的最大偏差的界限,即后悔。我们适应捕获嘈杂用户的方法,并最大限度地减少预期的遗憾。最后,我们展示了学习用户偏好的重要性以及在广泛的实验结果中使用真实的世界数据集进行环境监测问题的大量实验结果的性能。
translated by 谷歌翻译
多路径定向问题询问机器人团队的路径最大化收集的总奖励,同时满足路径长度上的预算约束。这个问题模拟了许多多机器人路由任务,例如探索未知的环境和环境监控信息。在本文中,我们专注于如何使机器人团队在对抗环境中运行时对故障的强大。我们介绍了强大的多路径定向事问题(RMOP),在那里我们寻求最糟糕的案例保证,反对能够在大多数$ \ Alpha $机器人处攻击的对手。我们考虑两个问题的两个版本:RMOP离线和RMOP在线。在离线版本中,当机器人执行其计划时,没有通信或重新扫描,我们的主要贡献是一种具有界限近似保证的一般近似方案,其取决于$ \ alpha $和单个机器人导向的近似因子。特别是,我们表明该算法在成本函数是模块化时产生(i)恒因子近似; (ii)在成本函数是子模具时,$ \ log $因子近似; (iii)当成本函数是子模块时的恒因子近似,但是允许机器人通过有界金额超过其路径预算。在在线版本中,RMOP被建模为双人顺序游戏,并基于蒙特卡罗树搜索(MCT),以后退地平线方式自适应解决。除了理论分析之外,我们还对海洋监测和隧道信息收集应用进行仿真研究,以证明我们的方法的功效。
translated by 谷歌翻译
我们考虑了提高柱生成效率(CG)方法的方法,以解决车辆路由问题。我们介绍了CG配方中常用的NG-Route松弛度和降低状态空间松弛(DSSR)的替代/补充,我们引入了局部区域(LA)路线。 LA路线是NG路由的子集和基本路线的超级集合。通常,CG的定价阶段必须产生基本路线,这些路线是没有重复客户的路线,使用可能在计算上昂贵的流程。非元素路线至少访问至少一个客户,创建一个周期。 LA路线以允许有效定价的方式放松成为基本途径的约束。从NG-Route放松方面,最好理解LA路线。 NG路由是允许在空间中具有非定位循环的路线。这意味着周期中至少有一个中间客户(称为断路器)必须考虑到周期中的起始客户在空间上远离。使用一组特殊索引来描述LA路线,该特殊索引与从开始到路线尽头的路线上的客户相对应。 LA路线的松弛进一步限制了一组允许的周期,除了强制执行断路器必须位于特殊索引中,该循环均超出了NG路由,其中​​一组特殊索引被递归地定义为如下。该路线中的第一个特殊索引是索引1,这意味着它与路线中的第一个客户关联。 K'th特殊索引对应于K-1第三个特殊索引之后的第一个客户,该索引并非被认为是(在空间上被认为是远离K-1'TEXPATEX的客户)的邻居。我们证明,与标准DSSR相比,LA路线松弛可以显着提高定价的计算速度。
translated by 谷歌翻译
我们提出了一种基于机器学习的新型方法来解决涉及大量独立关注者的二重性程序,作为一种特殊情况,其中包括两阶段随机编程。我们提出了一个优化模型,该模型明确考虑了追随者的采样子集,并利用机器学习模型来估计未采样关注者的客观值。与现有方法不同,我们将机器学习模型培训嵌入到优化问题中,这使我们能够采用无法使用领导者决策来表示的一般追随者功能。我们证明了由原始目标函数衡量的生成领导者决策的最佳差距,该目标函数考虑了整个追随者集。然后,我们开发追随者采样算法来收紧界限和一种表示追随者功能的表示方法,可以用作嵌入式机器学习模型的输入。使用骑自行车网络设计问题的合成实例,我们比较方法的计算性能与基线方法。我们的方法为追随者的目标价值观提供了更准确的预测,更重要的是,产生了更高质量的领导者决策。最后,我们对骑自行车基础设施计划进行了现实世界中的案例研究,我们采用方法来解决超过一百万关注者的网络设计问题。与当前的自行车网络扩展实践相比,我们的方法提出了有利的性能。
translated by 谷歌翻译
Coverage path planning is a major application for mobile robots, which requires robots to move along a planned path to cover the entire map. For large-scale tasks, coverage path planning benefits greatly from multiple robots. In this paper, we describe Turn-minimizing Multirobot Spanning Tree Coverage Star(TMSTC*), an improved multirobot coverage path planning (mCPP) algorithm based on the MSTC*. Our algorithm partitions the map into minimum bricks as tree's branches and thereby transforms the problem into finding the maximum independent set of bipartite graph. We then connect bricks with greedy strategy to form a tree, aiming to reduce the number of turns of corresponding circumnavigating coverage path. Our experimental results show that our approach enables multiple robots to make fewer turns and thus complete terrain coverage tasks faster than other popular algorithms.
translated by 谷歌翻译
在本文中,我们研究了电子商务运营商面临的顺序决策问题,与何时从中央仓库发送车辆以服务于客户请求,并在哪个命令下提供服务,假设是在到达仓库的包裹是随机且动态的。目的是最大化在服务时间内可以交付的包裹数。我们提出了两种解决此问题的强化学习方法,一种基于策略函数近似(PFA),第二种基于值函数近似(VFA)。两种方法都与前景策略相结合,其中未来发布日期以蒙特卡洛的方式进行采样,并使用量身定制的批处理方法来近似未来状态的价值。我们的PFA和VFA很好地利用了基于分支机构的精确方法来提高决策质量。我们还建立了足够的条件,可以将最佳策略的部分表征并将其集成到PFA/VFA中。在基于720个基准实例的实证研究中,我们使用具有完美信息的上限进行了竞争分析,我们表明PFA和VFA的表现极大地超过了两种替代近视方法。总体而言,PFA提供最佳解决方案,而VFA(从两阶段随机优化模型中受益)在解决方案质量和计算时间之间取得了更好的权衡。
translated by 谷歌翻译
组合优化是运营研究和计算机科学领域的一个公认领域。直到最近,它的方法一直集中在孤立地解决问题实例,而忽略了它们通常源于实践中的相关数据分布。但是,近年来,人们对使用机器学习,尤其是图形神经网络(GNN)的兴趣激增,作为组合任务的关键构件,直接作为求解器或通过增强确切的求解器。GNN的电感偏差有效地编码了组合和关系输入,因为它们对排列和对输入稀疏性的意识的不变性。本文介绍了对这个新兴领域的最新主要进步的概念回顾,旨在优化和机器学习研究人员。
translated by 谷歌翻译
Despite recent progress on trajectory planning of multiple robots and path planning of a single tethered robot, planning of multiple tethered robots to reach their individual targets without entanglements remains a challenging problem. In this paper, we present a complete approach to address this problem. Firstly, we propose a multi-robot tether-aware representation of homotopy, using which we can efficiently evaluate the feasibility and safety of a potential path in terms of (1) the cable length required to reach a target following the path, and (2) the risk of entanglements with the cables of other robots. Then, the proposed representation is applied in a decentralized and online planning framework that includes a graph-based kinodynamic trajectory finder and an optimization-based trajectory refinement, to generate entanglement-free, collision-free and dynamically feasible trajectories. The efficiency of the proposed homotopy representation is compared against existing single and multiple tethered robot planning approaches. Simulations with up to 8 UAVs show the effectiveness of the approach in entanglement prevention and its real-time capabilities. Flight experiments using 3 tethered UAVs verify the practicality of the presented approach.
translated by 谷歌翻译
物流运营商最近提出了一项技术,可以帮助降低城市货运分销中的交通拥堵和运营成本,最近提出了移动包裹储物柜(MPLS)。鉴于他们能够在整个部署领域搬迁,因此他们具有提高客户可访问性和便利性的潜力。在这项研究中,我们制定了移动包裹储物柜问题(MPLP),这是位置路由问题(LRP)的特殊情况,该案例确定了整天MPL的最佳中途停留位置以及计划相应的交付路线。开发了基于混合Q学习网络的方法(HQM),以解决所得大问题实例的计算复杂性,同时逃脱了本地Optima。此外,HQM与全球和局部搜索机制集成在一起,以解决经典强化学习(RL)方法所面临的探索和剥削困境。我们检查了HQM在不同问题大小(最多200个节点)下的性能,并根据遗传算法(GA)进行了基准测试。我们的结果表明,HQM获得的平均奖励比GA高1.96倍,这表明HQM具有更好的优化能力。最后,我们确定有助于车队规模要求,旅行距离和服务延迟的关键因素。我们的发现概述了MPL的效率主要取决于时间窗口的长度和MPL中断的部署。
translated by 谷歌翻译
我们介绍了多模式的汽车和乘车共享问题(MMCRP),其中使用一台汽车来涵盖一组乘车请求,同时将发现的请求分配给其他运输方式(MOT)。汽车的路线由一次或多个旅行组成。每次旅行都必须具有特定但不明的驱动程序,以仓库开始,然后以(可能不同的)仓库结束。即使两个骑行没有相同的起源和/或目的地,也允许在用户之间共享骑行。用户始终可以根据各个首选项列表使用其他运输方式。该问题可以作为车辆调度问题提出。为了解决该问题,构建了一个辅助图,在该图中,每次旅行在仓库中的启动和结尾,并覆盖可能的乘车共享,以时空图中的形式建模为弧。我们提出了一种基于列生成的两层分解算法,其中主问题可确保最多只能涵盖每个请求,并且定价问题通过在时间 - 时间中解决一种最短路径问题来生成新的有希望的路线空间网络。报告了基于现实实例的计算实验。基准实例基于奥地利维也纳的人口,空间和经济数据。我们通过在合理时间内基于列生成的方法来解决大型实例,并进一步研究了各种精确和启发式定价方案。
translated by 谷歌翻译
在本文中,我们研究了通过优化的流量路由的路径增加对运输网络的影响。特别是,我们研究了总旅行时间的行为,并考虑了自我利益的路由范式,例如用户平衡(UE)路由以及合作范式,例如经典多商品(MC)网络流量和系统最佳(因此)路由。我们提供了一个正式的框架,用于通过迭代路径添加设计运输网络,引入跨越树和跳跃路径图的概念。使用此形式化,我们证明了运输网络设计的目标函数的多个属性。由于基础路由问题是NP-HARD,因此我们研究了提供近似算法设计保证的属性。首先,尽管Braess的悖论表明,对于在自私路由(UE)下的路径添加(UE)方面,总旅行时间并不是单调的非侵扰,但我们证明,相反,单调性具有合作路由(MC等)。该结果具有重要的含义,即合作社可以充分利用冗余基础设施。其次,我们通过反例证证明,直观的语句``在传输网络中添加路径始终赋予用户更大或平等的好处,而不是将其添加到该网络的超集中'是错误的。换句话说,我们证明,对于所有研究的路由公式,相对于路径添加而言,总旅行时间不是超模型。尽管这种违反直觉结果为算法设计带来了硬度属性,但我们提供了特定的实例,而相反,超模型的属性则具有。我们关于相对于路径增加的总旅行时间的单调性和超模样的研究提供了正式的证明和场景,构成了运输网络设计师的重要见解。
translated by 谷歌翻译
使用团队或机器人联盟的任务分配是机器人技术,计算机科学,运营研究和人工智能中最重要的问题之一。在最近的工作中,研究集中在处理复杂的目标和可行性限制之间,这是多机器人任务分配问题的其他变化。在这些方向上有许多重要的研究进展的例子。我们提出了任务分配问题的一般表述,该问题概括了几个经过充分研究的版本。我们的表述包括机器人,任务和其操作周围环境的状态。我们描述问题如何根据可行性约束,目标函数和动态变化信息的水平而变化。此外,我们讨论了有关该问题的现有解决方案方法,包括基于优化的方法和基于市场的方法。
translated by 谷歌翻译
In the last years, there has been a great interest in machine-learning-based heuristics for solving NP-hard combinatorial optimization problems. The developed methods have shown potential on many optimization problems. In this paper, we present a learned heuristic for the reoptimization of a problem after a minor change in its data. We focus on the case of the capacited vehicle routing problem with static clients (i.e., same client locations) and changed demands. Given the edges of an original solution, the goal is to predict and fix the ones that have a high chance of remaining in an optimal solution after a change of client demands. This partial prediction of the solution reduces the complexity of the problem and speeds up its resolution, while yielding a good quality solution. The proposed approach resulted in solutions with an optimality gap ranging from 0\% to 1.7\% on different benchmark instances within a reasonable computing time.
translated by 谷歌翻译
在异构机器人网络上进行计算负载共享是一个有希望的方法,可以将机器人能力和效率作为极端环境中的团队提高。然而,在这种环境中,通信链路可以是间歇性的,并且与云或因特网的连接可能是不存在的。在本文中,我们介绍了用于多机器人系统的通信感知,计算任务调度问题,并提出了整数线性程序(ILP),该程序(ILP)优化了异构机器人网络中的计算任务分配,占网络机器人的计算能力对于可用(和可能的时变)通信链接。我们考虑调度由依赖关系图建模的一组相互依赖的必需任务和可选任务。我们为共享世界,分布式系统提供了一项备份的调度架构。我们验证了ILP制定和不同计算平台中的分布式实现,并在模拟场景中,偏向于月球或行星探索方案。我们的研究结果表明,与没有计算负载共享的类似系统相比,所提出的实施方式可以优化提高时间表以允许三倍增加所执行的奖励任务的数量(例如,科学测量)。
translated by 谷歌翻译