本文介绍了如何整合计算论证的跨学科研究问题,如在AI的研究中,具有认知,可以在认知科学,语言学和哲学中找到。它源于第一个研讨会的计算论证和认知(Cognitar),该工作室作为第24届人工智能(ECAI)的一部分组织,并于2020年9月8日进行了几乎举行。本文从一个开始简要介绍了计算论证和认知融合的科学动机,争论,在人以人为中心的环境中,从对认知研究的计算论证的理论和方法的使用可以是一个有前途的途径。给出了每个研讨会演示的简短摘要,示出了可以应用与研究认知的其他方法的计算论证理论和方法的综合问题。本文提出了在科学水平所需的领域所需的主要问题和挑战,也在认识学层面,特别是与涉及的各学科的思想和方法有关。
translated by 谷歌翻译
Dynamic Movement Primitives (DMP) have found remarkable applicability and success in various robotic tasks, which can be mainly attributed to their generalization and robustness properties. Nevertheless, their generalization is based only on the trajectory endpoints (initial and target position). Moreover, the spatial generalization of DMP is known to suffer from shortcomings like over-scaling and mirroring of the motion. In this work we propose a novel generalization scheme, based on optimizing online the DMP weights so that the acceleration profile and hence the underlying training trajectory pattern is preserved. This approach remedies the shortcomings of the classical DMP scaling and additionally allows the DMP to generalize also to intermediate points (via-points) and external signals (coupling terms), while preserving the training trajectory pattern. Extensive comparative simulations with the classical and other DMP variants are conducted, while experimental results validate the applicability and efficacy of the proposed method.
translated by 谷歌翻译
我们为视频中人类对象相互作用的视觉预测提供了一种新颖的方法。我们旨在预测(a)正在进行的人类对象相互作用的类别以及(b)下一个活性对象的类(e)(b)s)(naos),即,将在不久的将来以及相互作用发生的时间中涉及的对象(s)。图形匹配依赖于有效的图表编辑距离(GED)方法。使用两个包含人类对象相互作用的视频数据集进行了对拟议方法的实验评估,即MSR日常活动和CAD120。对于动作预测和NAO预测,获得了高预测精度。
translated by 谷歌翻译
分配转移或培训数据和部署数据之间的不匹配是在高风险工业应用中使用机器学习的重要障碍,例如自动驾驶和医学。这需要能够评估ML模型的推广以及其不确定性估计的质量。标准ML基线数据集不允许评估这些属性,因为培训,验证和测试数据通常相同分布。最近,已经出现了一系列专用基准测试,其中包括分布匹配和转移的数据。在这些基准测试中,数据集在任务的多样性以及其功能的数据模式方面脱颖而出。虽然大多数基准测试由2D图像分类任务主导,但Shifts包含表格天气预测,机器翻译和车辆运动预测任务。这使得可以评估模型的鲁棒性属性,并可以得出多种工业规模的任务以及通用或直接适用的特定任务结论。在本文中,我们扩展了偏移数据集,其中两个数据集来自具有高社会重要性的工业高风险应用程序。具体而言,我们考虑了3D磁共振脑图像中白质多发性硬化病变的分割任务以及海洋货物容器中功耗的估计。两项任务均具有无处不在的分配变化和由于错误成本而构成严格的安全要求。这些新数据集将使研究人员能够进一步探索新情况下的强大概括和不确定性估计。在这项工作中,我们提供了两个任务的数据集和基线结果的描述。
translated by 谷歌翻译
在涉及矩阵计算的问题中,杠杆的概念发现了大量应用。特别是,将矩阵的列与其领先的单数矢量跨越的子空间相关联的杠杆分数有助于揭示列亚集,以大约将矩阵分配给具有质量保证的矩阵。因此,它们为各种机器学习方法提供了坚实的基础。在本文中,我们扩展了杠杆分数的定义,以将矩阵的列与单数矢量的任意子集相关联。我们通过将杠杆分数和子空间之间的主要角度的概念联系起来,在列和奇异矢量子集之间建立精确的联系。我们采用此结果来设计近似算法,并为两个众所周知的问题提供可证明的保证:广义列子集选择和稀疏的规范相关分析。我们运行数值实验,以进一步了解所提出的方法。我们得出的新颖界限提高了我们对矩阵近似中基本概念的理解。此外,我们的见解可能是进一步贡献的基础。
translated by 谷歌翻译
图像中的对象状态的检测(状态检测 - SD)是理论和实际重要性的问题,并且它与其他重要的计算机视觉问题紧密地交织,例如动作识别和承受性检测。它对任何需要有理由和在动态域名的实体的实体也非常相关,例如机器人系统和智能代理人。尽管重要的是,到目前为止,这一问题的研究已经有限。在本文中,我们尝试了对SD问题的系统研究。首先,我们介绍了对象状态检测数据集(OSDD),这是一个由19,000个注释为18个对象类别和9个州类的注释组成的新公共可用数据集。其次,使用用于对象检测(OD)的标准深度学习框架,我们进行多项适当设计的实验,深入研究SD问题的行为。本研究能够在各种场景中实现SD的性能的基准,以及与OD相比的相对性能。总的来说,实验结果证实,SD比OD更难,需要制定定制的SD方法来有效地解决这一重大问题。
translated by 谷歌翻译
已经证明了视觉变压器架构以非常有效地为图像分类任务工作。用变压器依靠卷积骨架解决更具挑战性的愿景任务的努力,以进行特征提取。在本文中,我们调查使用纯变压器架构(即,没有CNN骨干网)的使用,用于2D体姿势估计的问题。我们在Coco DataSet上评估了两个Vit架构。我们演示了使用编码器 - 解码器变压器架构产生最新的技术结果,导致该估计问题。
translated by 谷歌翻译
手工姿势和形状估计研究领域的数据集和工具的数量和质量作为所做的重大进展的证据。然而,即使是迄今为止报告的最高质量的数据集,也具有注释的缺点。我们提出了一种基于可分辨率的射线跟踪的细化方法,并演示了如何具有高质量的公共可用的,双摄像机数据集(Interwand2.6m)可以成为一个更好的数据集,相对于注释质量。到目前为止,迄今未采用可分辨率的射线跟踪,特此被证明优于过去已经采用的近似替代品。为了解决缺乏可靠的地面真理,就量化评估而言,我们求助于现实的合成数据,表明我们诱导的改进确实很重要。通过视觉评估,实际数据中的实际数据也是如此。
translated by 谷歌翻译