人工智能和自动化方面的最新发展可能会导致新的药物设计范式:自主药物设计。在此范式下,生成模型就具有特定特性的数千个分子提供了建议。但是,由于只能合成和测试有限数量的分子,因此一个明显的挑战是如何有效选择这些分子。我们将这项任务作为上下文随机的多军强盗问题,具有多个戏剧和挥发性臂。然后,为了解决它,我们将以前的多臂匪徒扩展到反映这种设置,并将我们的解决方案与随机采样,贪婪的选择和腐烂的epsilon-greedy选择进行比较。为了研究不同选择策略如何影响选择的累积奖励和多样性,我们模拟了药物设计过程。根据仿真结果,我们的方法具有更好地探索和利用自主药物设计的化学空间的潜力。
translated by 谷歌翻译
We introduce ensembles of stochastic neural networks to approximate the Bayesian posterior, combining stochastic methods such as dropout with deep ensembles. The stochastic ensembles are formulated as families of distributions and trained to approximate the Bayesian posterior with variational inference. We implement stochastic ensembles based on Monte Carlo dropout, DropConnect and a novel non-parametric version of dropout and evaluate them on a toy problem and CIFAR image classification. For CIFAR, the stochastic ensembles are quantitatively compared to published Hamiltonian Monte Carlo results for a ResNet-20 architecture. We also test the quality of the posteriors directly against Hamiltonian Monte Carlo simulations in a simplified toy model. Our results show that in a number of settings, stochastic ensembles provide more accurate posterior estimates than regular deep ensembles.
translated by 谷歌翻译
Research connecting text and images has recently seen several breakthroughs, with models like CLIP, DALL-E 2, and Stable Diffusion. However, the connection between text and other visual modalities, such as lidar data, has received less attention, prohibited by the lack of text-lidar datasets. In this work, we propose LidarCLIP, a mapping from automotive point clouds to a pre-existing CLIP embedding space. Using image-lidar pairs, we supervise a point cloud encoder with the image CLIP embeddings, effectively relating text and lidar data with the image domain as an intermediary. We show the effectiveness of LidarCLIP by demonstrating that lidar-based retrieval is generally on par with image-based retrieval, but with complementary strengths and weaknesses. By combining image and lidar features, we improve upon both single-modality methods and enable a targeted search for challenging detection scenarios under adverse sensor conditions. We also use LidarCLIP as a tool to investigate fundamental lidar capabilities through natural language. Finally, we leverage our compatibility with CLIP to explore a range of applications, such as point cloud captioning and lidar-to-image generation, without any additional training. We hope LidarCLIP can inspire future work to dive deeper into connections between text and point cloud understanding. Code and trained models available at https://github.com/atonderski/lidarclip.
translated by 谷歌翻译
在本文中,我们证明了基于深度学习的方法可用于融合多对象密度。给定一个带有几个传感器可能不同视野的传感器的方案,跟踪器在每个传感器中在本地执行跟踪,该跟踪器会产生随机有限的集合多对象密度。为了融合来自不同跟踪器的输出,我们调整了最近提出的基于变压器的多对象跟踪器,其中融合结果是一个全局的多对象密度,描述了当前时间的所有活物体。我们将基于变压器的融合方法与基于模型的贝叶斯融合方法的性能进行比较,在几种模拟方案中,使用合成数据进行了不同的参数设置。仿真结果表明,基于变压器的融合方法在我们的实验场景中优于基于模型的贝叶斯方法。
translated by 谷歌翻译
本文提供了在标记的随机有限套装文献中使用的自适应出生模型与带有点目标模型的Poisson Multi-Bernoulli混合物(PMBM)滤波器中使用的轨道启动之间的比较分析。 PMBM轨道启动是通过对预测的PMBM密度应用的贝叶斯规则获得的,并为每个接收的测量值创建一个Bernoulli组件,表示该测量可能是混乱或从新目标中检测的。自适应出生模拟此过程,通过使用不同的规则为每个测量创建一个伯努利组件来确定存在的概率和用户定义的单目标密度。本文首先对基于孤立测量的轨道启动中产生的差异进行了分析。然后,它表明自适应出生低估了共同建模假设下监视区域中存在的对象数量。最后,我们提供数值模拟,以进一步说明差异。
translated by 谷歌翻译
蒙面自动编码已成为用于文本,图像和最近的点云的变压器模型的成功预训练范例。原始汽车数据集是适合自我监督预训练的合适候选者,因为与3D对象检测(OD)等任务的注释相比,它们通常便宜地收集。但是,开发点云的蒙版自动编码器仅关注合成和室内数据。因此,现有方法已将其表示和模型定制为小,密度且具有均匀点密度的点云。在这项工作中,我们在汽车环境中研究了蒙版的自动编码,该自动编码是稀疏的,并且点密度在同一场景中的对象之间可能会大不相同。为此,我们提出了Voxel-MAE,这是一种为体素表示设计的简单掩盖自动编码预训练方案。我们将基于变压器的3D对象检测器的骨干培养为重建掩盖的体素并区分空的和非空的体素。我们的方法将3D OD性能提高了1.75个地图点和1.05 nds的NUSCENES数据集。与现有的汽车数据自我监督方法相比,Voxel-Mae显示出$ 2 \ times $ $的性能提高。此外,我们表明,通过对Voxel-Mae进行预训练,我们仅需要40%的注释数据即可超过随机初始化的等效物。代码将发布。
translated by 谷歌翻译
准确的不确定性估计对于在安全关键系统中部署深层对象探测器至关重要。概率对象探测器的开发和评估受到现有绩效指标的缺点的阻碍,这些绩效指标倾向于涉及任意阈值或限制检测器的分布选择。在这项工作中,我们建议将对象检测视为设置预测任务,其中检测器预测对象集的分布。使用负面的对数可能性进行随机有限集,我们提出了一个适当的评分规则,用于评估和训练概率对象探测器。所提出的方法可以应用于现有的概率检测器,没有阈值,并可以在体系结构之间进行公平的比较。在可可数据集上评估了三种不同类型的检测器。我们的结果表明,现有检测器的培训已针对非稳定指标进行了优化。我们希望鼓励开发新的对象探测器,这些探测器可以准确估计自己的不确定性。代码可在https://github.com/georghess/pmb-nll上找到。
translated by 谷歌翻译
我们分析了旋转模糊性在应​​用于球形图像的卷积神经网络(CNN)中的作用。我们比较了被称为S2CNN的组等效网络的性能和经过越来越多的数据增强量的标准非等级CNN。所选的体系结构可以视为相应设计范式的基线参考。我们的模型对投影到球体的MNIST或FashionMnist数据集进行了训练和评估。对于固有旋转不变的图像分类的任务,我们发现,通过大大增加数据增强量和网络的大小,标准CNN可以至少达到与Equivariant网络相同的性能。相比之下,对于固有的等效性语义分割任务,非等级网络的表现始终超过具有较少参数的模棱两可的网络。我们还分析和比较了不同网络的推理潜伏期和培训时间,从而实现了对等效架构和数据扩展之间的详细权衡考虑,以解决实际问题。实验中使用的均衡球网络可在https://github.com/janegerken/sem_seg_s2cnn上获得。
translated by 谷歌翻译
5G毫米波(MMWAVE)信号与传播信道和传播环境具有固有的几何连接。因此,它们可用于共同本地化接收器并映射传播环境,该传播环境被称为同时定位和映射(SLAM)。5G SLAM中最重要的任务之一是处理测量模型的非线性。为了解决这个问题,现有的5G SLAM依赖于Sigma点或扩展卡尔曼滤波器,针对现有概率密度函数(PDF)线性化测量功能。在本文中,我们研究了关于后部PDF的测量功能的线性化,并将迭代后线性化滤波器实施到泊松多Bernoulli Slam滤波器中。仿真结果表明了所得SLAM过滤器的精度和精确改善。
translated by 谷歌翻译
编程微控制器涉及使用并发和反应的硬件和外围设备的低级接口。这些程序通常使用并发语言扩展(如$ \ texttt {freertos tasks} $和$ \ texttt {sevaphores} $),以c和组装的混合编写,导致不安全,回调驱动,容易出错和困难 - 维护代码。我们通过介绍$ \ texttt {sensevm} $ - 一个字节码解释的虚拟机来解决这一挑战,该虚拟机提供了一种基于邮件传递的$ \ Textit {高阶并发} $型号,用于Microctroller编程。该模型将同步操作视为类似于功能语言的一流函数的一流价值(称为$ \ texttt {events} $)。这主要允许程序员撰写和量身定制自己的并发抽象,另外,摘要摘要不安全的内存操作,共享内存并发模型中的常见,从而使微控制器程序更安全,可组合和更容易维护。我们的VM通过低级$ \ Textit {Bridge} $界面进行便携式,内置嵌入式OS - Zephyr。桥梁由所有驱动程序实现,并设计成使得响应于软件消息或硬件中断的编程仍然是均匀的并且无法区分。在本文中,我们通过以CAML的功能语言编写的示例演示了VM的功能,在$ \ texttt {nrf52840} $和$ \ texttt {stm32f4} $微控制器上运行。
translated by 谷歌翻译