智能论文笔记

DronePose: The identification, segmentation, and orientation detection of drones via neural networks

Stirling Scholes , Alice Ruget , German Mora-Martin , Feng Zhu , Istvan Gyongy , Jonathan Leach

分类：计算机视觉

2021-12-10

无畏的不断增长的无情地提出了传统空中空间监测技术准确表征此类车辆的能力的担忧。在这里，我们使用决策树和集合结构呈现CNN，以在飞行中完全表征无人机。我们的系统确定无人机类型，方向（在音高，滚动和偏航方面），并执行分割以分类不同的身体部位（发动机，主体和相机）。我们还提供了一种计算机模型，用于快速生成大量标记的照片 - 现实培训数据，并证明该数据具有足够的保真度，以允许系统在飞行中准确地表征真正的无人机。我们的网络将在图像处理链中提供一个有价值的工具，可以在现有的无人机检测技术上建立，以提供广泛区域的完整无人机表征。

translated by 谷歌翻译

Vision-Based Environmental Perception for Autonomous Driving

Fei Liu , Zihao Lu , Xianke Lin

分类：计算机视觉

2022-12-22

Visual perception plays an important role in autonomous driving. One of the primary tasks is object detection and identification. Since the vision sensor is rich in color and texture information, it can quickly and accurately identify various road information. The commonly used technique is based on extracting and calculating various features of the image. The recent development of deep learning-based method has better reliability and processing speed and has a greater advantage in recognizing complex elements. For depth estimation, vision sensor is also used for ranging due to their small size and low cost. Monocular camera uses image data from a single viewpoint as input to estimate object depth. In contrast, stereo vision is based on parallax and matching feature points of different views, and the application of deep learning also further improves the accuracy. In addition, Simultaneous Location and Mapping (SLAM) can establish a model of the road environment, thus helping the vehicle perceive the surrounding environment and complete the tasks. In this paper, we introduce and compare various methods of object detection and identification, then explain the development of depth estimation and compare various methods based on monocular, stereo, and RDBG sensors, next review and compare various methods of SLAM, and finally summarize the current problems and present the future development trends of vision technologies.

translated by 谷歌翻译

Drone Detection and Tracking in Real-Time by Fusion of Different Sensing Modalities

Fredrik Svanström , Fernando Alonso-Fernandez , Cristofer Englund

分类：计算机视觉

2022-07-05

自动检测飞行无人机是一个关键问题，其存在（特别是未经授权）可以造成风险的情况或损害安全性。在这里，我们设计和评估了多传感器无人机检测系统。结合常见的摄像机和麦克风传感器，我们探索了热红外摄像机的使用，指出是一种可行且有希望的解决方案，在相关文献中几乎没有解决。我们的解决方案还集成了鱼眼相机，以监视天空的更大部分，并将其他摄像机转向感兴趣的对象。传感溶液与ADS-B接收器，GPS接收器和雷达模块相辅相成，尽管由于其有限的检测范围，后者未包含在我们的最终部署中。即使此处使用的摄像机的分辨率较低，热摄像机也被证明是与摄像机一样好的可行解决方案。我们作品的另外两个新颖性是创建一个新的公共数据集的多传感器注释数据，该数据与现有的类别相比扩大了类的数量，以及对探测器性能的研究作为传感器到传感器的函数的研究目标距离。还探索了传感器融合，表明可以以这种方式使系统更强大，从而减轻对单个传感器的虚假检测

translated by 谷歌翻译

Towards Live Video Analytics with On-Drone Deeper-yet-Compatible Compression

Junpeng Guo , Chunyi Peng

分类：计算机视觉

2021-11-10

在这项工作中，我们呈现了DCC（更深层兼容的压缩），用于实时无人机的辅助边缘辅助视频分析的一个启用技术，内置于现有编解码器之上。DCC解决了一个重要的技术问题，以将流动的视频从无人机压缩到边缘，而不会严格地在边缘执行的视频分析任务的准确性和及时性。DCC通过流式视频中的每一位对视频分析同样有价值，这是对视频分析的同样有价值，这在传统的分析透视技术编解码器技术上打开了新的压缩室。我们利用特定的无人机的上下文和中级提示，从物体检测中追求保留分析质量所需的自适应保真度。我们在一个展示车辆检测应用中有原型DCC，并验证了其代表方案的效率。DCC通过基线方法减少9.5倍，在最先进的检测精度上，19-683％的速度减少了9.5倍。

translated by 谷歌翻译

Integrating Deep Learning and Augmented Reality to Enhance Situational Awareness in Firefighting Environments

Manish Bhattarai

分类：计算机视觉

2021-07-23

我们提出了一种新的四管齐下的方法，在文献中首次建立消防员的情境意识。我们构建了一系列深度学习框架，彼此之叠，以提高消防员在紧急首次响应设置中进行的救援任务的安全性，效率和成功完成。首先，我们使用深度卷积神经网络（CNN）系统，以实时地分类和识别来自热图像的感兴趣对象。接下来，我们将此CNN框架扩展了对象检测，跟踪，分割与掩码RCNN框架，以及具有多模级自然语言处理（NLP）框架的场景描述。第三，我们建立了一个深入的Q学习的代理，免受压力引起的迷失方向和焦虑，能够根据现场消防环境中观察和存储的事实来制定明确的导航决策。最后，我们使用了一种低计算无监督的学习技术，称为张量分解，在实时对异常检测进行有意义的特征提取。通过这些临时深度学习结构，我们建立了人工智能系统的骨干，用于消防员的情境意识。要将设计的系统带入消防员的使用，我们设计了一种物理结构，其中处理后的结果被用作创建增强现实的投入，这是一个能够建议他们所在地的消防员和周围的关键特征，这对救援操作至关重要在手头，以及路径规划功能，充当虚拟指南，以帮助迷彩的第一个响应者恢复安全。当组合时，这四种方法呈现了一种新颖的信息理解，转移和综合方法，这可能会大大提高消防员响应和功效，并降低寿命损失。

translated by 谷歌翻译

PencilNet: Zero-Shot Sim-to-Real Transfer Learning for Robust Gate Perception in Autonomous Drone Racing

Huy Xuan Pham , Andriy Sarabakha , Mykola Odnoshyvkin , Erdal Kayacan

分类：机器人

2022-07-28

在自主和移动机器人技术中，主要挑战之一是对环境的坚强感知，通常是未知和动态的，例如自主无人机赛车。在这项工作中，我们提出了一种新型的基于神经网络的感知方法，用于赛车门检测 - 铅笔网 - 依赖于铅笔过滤器顶部的轻质神经网络骨架。这种方法统一了对盖茨的2D位置，距离和方向的预测。我们证明我们的方法对于不需要任何现实世界训练样本的零射击SIM到运行转移学习有效。此外，与最先进的方法相比，在快速飞行下通常看到的照明变化非常强大。一组彻底的实验证明了这种方法在多种挑战的情况下的有效性，在多种挑战性的情况下，无人机在不同的照明条件下完成了各种轨道。

translated by 谷歌翻译

High Resolution Point Clouds from mmWave Radar

Akarsh Prabhakara , Tao Jin , Arnav Das , Gantavya Bhatt , Lilly Kumari , Elahe Soltanaghaei , Jeff Bilmes , Swarun Kumar , Anthony Rowe

分类：机器人

2022-06-18

本文探讨了一种机器学习方法，用于从单芯片MMWave雷达产生高分辨率点云。与激光雷达和基于视觉的系统不同，MMWave雷达可以在恶劣的环境中运行，并通过烟雾，雾气和灰尘等遮挡。不幸的是，与激光点云相比，当前的MMWAVE处理技术可提供差的空间分辨率。本文介绍了Radarhd，这是一种端到端的神经网络，该网络从低分辨率雷达输入中构造了激光雷达点云。由于存在镜面和虚假的反射，增强雷达图像是具有挑战性的。由于信号的类似SINC的扩展模式，雷达数据也不能很好地映射到传统的图像处理技术。我们通过在大量的RAW I/Q雷达数据上训练Radarhd与各种室内环境中的LiDar Point云配对来克服这些挑战。我们的实验表明，即使在训练期间未观察到的场景和存在浓烟的情况下，也能够产生丰富的点云。此外，Radarhd的点云足够高，足以与现有的LiDAR ODOMETIRE和映射工作流程配合使用。

translated by 谷歌翻译

Pixels2Pose: Super-Resolution Time-of-Flight Imaging for 3D Pose Estimation

Alice Ruget , Max Tyler , Germán Mora Martín , Stirling Scholes , Feng Zhu , Istvan Gyongy , Brent Hearn , Steve McLaughlin , Abderrahim Halimi , Jonathan Leach

分类：计算机视觉

2021-10-11

单光子敏感的深度传感器正在越来越多地用于人类姿势和手势识别的下一代电子。但是，具有成本效益的传感器通常具有低空间分辨率，从而将其用于基本运动识别和简单的对象检测。在这里，我们执行一个时间到空间映射，从而大大增加了简单飞行时间传感器的分辨率，即〜初始分辨率为4 $ \ times $ 4像素到分辨率32 $ \ times $ 32像素的深度图像。然后，可以将输出深度图用于准确的三维人姿势估计多人。我们开发了一个新的可解释框架，该框架为我们的网络如何利用其输入数据提供了直觉，并提供了有关相关参数的关键信息。我们的工作大大扩展了简单的飞机飞行时间传感器的用例，并为将来应用于具有相似数据类型的其他类型的传感器（即雷达和声纳）开辟了有希望的可能性。

translated by 谷歌翻译

Image Segmentation to Identify Safe Landing Zones for Unmanned Aerial Vehicles

Joe Kinahan , Alan F. Smeaton

分类：计算机视觉

2021-11-29

城市地区的送货服务销售服务显着增加，与杰夫贝斯宣称，亚马逊船舶重量少于5磅的订单中的86％是成熟的，以对自动化进程的最终阶段的经济性方法进行调查。随着半自动无人机送货服务的出现，如爱尔兰启动“Manna”和马耳他的“Skymax”，交货之旅的最后一步仍然是最难自动化的。本文调查了使用单个RGB摄像机在UAV上捕获的简单图像，以区分安全和不安全的着陆区域。我们调查语义图像分割框架作为识别安全着陆区域的一种方法，并展示了轻量级模型的准确性，最小化所需的传感器数量。通过使用图像而不是视频，我们减少了识别无人机的安全起落区所需的能量，而无需人为干预。

translated by 谷歌翻译

Vision-State Fusion: Improving Deep Neural Networks for Autonomous Robotics

Elia Cereda , Stefano Bonato , Mirko Nava , Alessandro Giusti , Daniele Palossi

分类：机器人

2022-06-13

基于视觉的感知任务在机器人技术中扮演着重要角色，促进解决许多具有挑战性的情景的解决方案，例如自动无人驾驶汽车（UAV）的杂技演习以及机器人辅助的高精度手术。大多数以控制为导向的和以自负的感知问题通常是通过利用机器人状态估计作为辅助输入来解决的，尤其是当人工智能进入图片时。在这项工作中，我们建议第一次采用类似的方法（据我们所知），将目标变量引用于外部主题。我们证明了我们的一般和直观方法论如何改善深层卷积神经网络（CNN）的回归性能，并具有模棱两可的问题，例如同类3D姿势估计。通过分析三个高度差异的用例，从用机器人臂抓住到具有袖珍尺寸无人机的人类受试者，我们的结果始终将R2度量提高到+0.514，而不是其无状态基准。最后，我们验证了人类姿势估计任务中闭环自动袋大小的无人机的现场性能。我们的结果表明，在我们的状态CNN的平均绝对误差上，平均降低了24％。

translated by 谷歌翻译

Autonomous Driving in Adverse Weather Conditions: A Survey

Yuxiao Zhang , Alexander Carballo , Hanting Yang , Kazuya Takeda

分类：机器人

2021-12-16

自动化驾驶系统（广告）开辟了汽车行业的新领域，为未来的运输提供了更高的效率和舒适体验的新可能性。然而，在恶劣天气条件下的自主驾驶已经存在，使自动车辆（AVS）长时间保持自主车辆（AVS）或更高的自主权。本文评估了天气在分析和统计方式中为广告传感器带来的影响和挑战，并对恶劣天气条件进行了解决方案。彻底报道了关于对每种天气的感知增强的最先进技术。外部辅助解决方案如V2X技术，当前可用的数据集，模拟器和天气腔室的实验设施中的天气条件覆盖范围明显。通过指出各种主要天气问题，自主驾驶场目前正在面临，近年来审查硬件和计算机科学解决方案，这项调查概述了在不利的天气驾驶条件方面的障碍和方向的障碍和方向。

translated by 谷歌翻译

Target Chase, Wall Building, and Fire Fighting: Autonomous UAVs of Team NimbRo at MBZIRC 2020

Marius Beul , Max Schwarz , Jan Quenzel , Malte Splietker , Simon Bultmann , Daniel Schleich , Andre Rochow , Dmytro Pavlichenko , Radu Alexandru Rosu , Patrick Lowin

分类：机器人

2022-01-11

Mohamed Bin Zayed国际机器人挑战（MBZIRC）2020为无人机（无人机）构成了不同的挑战。我们提供了四个量身定制的无人机，专门为MBZIRC的单独空中机器人任务开发，包括自定义硬件和软件组件。在挑战1中，使用高效率，车载对象检测管道进行目标UAV，以捕获来自目标UAV的球。第二个UAV使用类似的检测方法来查找和流行散落在整个竞技场的气球。对于挑战2，我们展示了一种能够自主空中操作的更大的无人机：从相机图像找到并跟踪砖。随后，将它们接近，挑选，运输并放在墙上。最后，在挑战3中，我们的UAV自动发现使用LIDAR和热敏摄像机的火灾。它用船上灭火器熄灭火灾。虽然每个机器人都具有任务特定的子系统，但所有无人机都依赖于为该特定和未来竞争开发的标准软件堆栈。我们介绍了我们最开源的软件解决方案，包括系统配置，监控，强大无线通信，高级控制和敏捷轨迹生成的工具。为了解决MBZirc 2020任务，我们在多个研究领域提出了机器视觉和轨迹生成的多个研究领域。我们介绍了我们的科学贡献，这些贡献构成了我们的算法和系统的基础，并分析了在阿布扎比的MBZIRC竞赛2020年的结果，我们的系统在大挑战中达到了第二名。此外，我们讨论了我们参与这种复杂的机器人挑战的经验教训。

translated by 谷歌翻译

Unauthorized Drone Detection: Experiments and Prototypes

Muhammad Asif Khan , Hamid Menouar , Osama Muhammad Khalid , Adnan Abu-Dayya

分类：计算机视觉 | 机器学习

2022-12-02

The increase in the number of unmanned aerial vehicles a.k.a. drones pose several threats to public privacy, critical infrastructure and cyber security. Hence, detecting unauthorized drones is a significant problem which received attention in the last few years. In this paper, we present our experimental work on three drone detection methods (i.e., acoustic detection, radio frequency (RF) detection, and visual detection) to evaluate their efficacy in both indoor and outdoor environments. Owing to the limitations of these schemes, we present a novel encryption-based drone detection scheme that uses a two-stage verification of the drone's received signal strength indicator (RSSI) and the encryption key generated from the drone's position coordinates to reliably detect an unauthorized drone in the presence of authorized drones.

translated by 谷歌翻译

A Review of Indoor Millimeter Wave Device-based Localization and Device-free Sensing Technologies

Anish Shastri , Neharika Valecha , Enver Bashirov , Harsh Tataria , Michael Lentmaier , Fredrik Tufvesson , Michele Rossi , Paolo Casari

分类：机器学习

2021-12-10

低成本毫米波（MMWAVE）通信和雷达设备的商业可用性开始提高消费市场中这种技术的渗透，为第五代（5G）的大规模和致密的部署铺平了道路（5G） - 而且以及6G网络。同时，普遍存在MMWAVE访问将使设备定位和无设备的感测，以前所未有的精度，特别是对于Sub-6 GHz商业级设备。本文使用MMWAVE通信和雷达设备在基于设备的定位和无设备感应中进行了现有技术的调查，重点是室内部署。我们首先概述关于MMWAVE信号传播和系统设计的关键概念。然后，我们提供了MMWaves启用的本地化和感应方法和算法的详细说明。我们考虑了在我们的分析中的几个方面，包括每个工作的主要目标，技术和性能，每个研究是否达到了一定程度的实现，并且该硬件平台用于此目的。我们通过讨论消费者级设备的更好算法，密集部署的数据融合方法以及机器学习方法的受过教育应用是有前途，相关和及时的研究方向的结论。

translated by 谷歌翻译

A review of machine learning in processing remote sensing data for mineral exploration

Hojat Shirmard , Ehsan Farahbakhsh , R. Dietmar Muller , Rohitash Chandra

分类：机器学习 | 计算机视觉

2021-03-13

近年来，新发现的矿物沉积物数量和不同矿物质需求的增加有LED探索地质学家，寻找在矿物勘探的每个阶段加工不同数据类型的更有效和创新的方法。作为主要步骤，诸如岩性单元，改变类型，结构和指示剂矿物的各种特征被映射以辅助靶向矿床的决策。不同类型的遥感数据集如卫星和空气传播数据，使得可以克服与映射地质特征相关的常见问题。从不同平台获得的遥感数据量的快速增加鼓励科学家培养先进，创新和强大的数据处理方法。机器学习方法可以帮助处理广泛的遥感数据集，并确定诸如反射连续体和感兴趣的特征的组件之间的关系。这些方法在处理频谱和地面真理测量中是稳健的，用于噪声和不确定性。近年来，通过补充与遥感数据集的地质调查进行了许多研究，现在在地球科学研究中突出。本文对一些流行的和最近建立的机器学习方法的实施和适应提供了全面的审查，用于处理不同类型的遥感数据，并调查其用于检测各种矿床类型的应用。我们展示了组合遥感数据和机器学习方法的高能力，以映射对于提供潜在地图至关重要的不同地质特征。此外，我们发现高级方法的范围来处理新一代遥感数据，以创建改进的矿物前景图。

translated by 谷歌翻译

Roadmap on Signal Processing for Next Generation Measurement Systems

D. K. Iakovidis , M. Ooi , Y. C. Kuang , S. Damidenko , A. Shestakov , V. Sinistin , M. Henry , A. Sciacchitano , A. Discetti , S. Donati

分类：人工智能 | 计算机视觉

2021-11-03

信号处理是几乎任何传感器系统的基本组件，具有不同科学学科的广泛应用。时间序列数据，图像和视频序列包括可以增强和分析信息提取和量化的代表性形式的信号。人工智能和机器学习的最近进步正在转向智能，数据驱动，信号处理的研究。该路线图呈现了最先进的方法和应用程序的关键概述，旨在突出未来的挑战和对下一代测量系统的研究机会。它涵盖了广泛的主题，从基础到工业研究，以简明的主题部分组织，反映了每个研究领域的当前和未来发展的趋势和影响。此外，它为研究人员和资助机构提供了识别新前景的指导。

translated by 谷歌翻译

3D shape sensing and deep learning-based segmentation of strawberries

Justin Le Louëdec , Grzegorz Cielniak

分类：计算机视觉 | 机器学习 | 机器人

2021-11-26

农业部门的自动化和机器人被视为该行业面临的社会经济挑战的可行解决方案。该技术经常依赖于提供有关作物，植物和整个环境的信息的智能感知系统。传统的2D视觉系统面临的挑战可以由现代3D视觉系统解决，使物体，尺寸和形状估计的直接定位或闭塞的处理能够。到目前为止，使用3D感测主要限于室内或结构化环境。在本文中，我们评估了现代传感技术，包括立体声和飞行时间摄像机，用于在农业中的形状的3D感知，并根据其形状从背景中分割软果实的可用性。为此，我们提出了一种新颖的3D深度神经网络，其利用来自基于相机的3D传感器的信息的有组织性质。与最先进的3D网络相比，我们展示了所提出的体系结构的卓越性能和效率。通过模拟研究，我们还显示了农业中对象分割的3D感测范例的潜力，并提供了洞察力和分析所需的形状质量和预期作物的进一步分析。这项工作的结果应该鼓励研究人员和公司开发更准确和强大的3D传感技术，以确保他们在实际农业应用中更广泛的采用。

translated by 谷歌翻译

Visual and Object Geo-localization: A Comprehensive Survey

Daniel Wilson , Xiaohan Zhang , Waqas Sultani , Safwan Wshah

分类：计算机视觉

2021-12-30

地理定位的概念是指确定地球上的某些“实体”的位置的过程，通常使用全球定位系统（GPS）坐标。感兴趣的实体可以是图像，图像序列，视频，卫星图像，甚至图像中可见的物体。由于GPS标记媒体的大规模数据集由于智能手机和互联网而迅速变得可用，而深入学习已经上升以提高机器学习模型的性能能力，因此由于其显着影响而出现了视觉和对象地理定位的领域广泛的应用，如增强现实，机器人，自驾驶车辆，道路维护和3D重建。本文提供了对涉及图像的地理定位的全面调查，其涉及从捕获图像（图像地理定位）或图像内的地理定位对象（对象地理定位）的地理定位的综合调查。我们将提供深入的研究，包括流行算法的摘要，对所提出的数据集的描述以及性能结果的分析来说明每个字段的当前状态。

translated by 谷歌翻译

A Survey of Deep Learning Techniques for Autonomous Driving

Sorin Grigorescu , Bogdan Trasnea , Tiberiu Cocias , Gigel Macesanu

分类：

2019-10-17

The last decade witnessed increasingly rapid progress in self-driving vehicle technology, mainly backed up by advances in the area of deep learning and artificial intelligence. The objective of this paper is to survey the current state-of-the-art on deep learning technologies used in autonomous driving. We start by presenting AI-based self-driving architectures, convolutional and recurrent neural networks, as well as the deep reinforcement learning paradigm. These methodologies form a base for the surveyed driving scene perception, path planning, behavior arbitration and motion control algorithms. We investigate both the modular perception-planning-action pipeline, where each module is built using deep learning methods, as well as End2End systems, which directly map sensory information to steering commands. Additionally, we tackle current challenges encountered in designing AI architectures for autonomous driving, such as their safety, training data sources and computational hardware. The comparison presented in this survey helps to gain insight into the strengths and limitations of deep learning and AI approaches for autonomous driving and assist with design choices. 1

translated by 谷歌翻译

Image sensing with multilayer, nonlinear optical neural networks

Tianyu Wang , Mandar M. Sohoni , Logan G. Wright , Martin M. Stein , Shi-Yuan Ma , Tatsuhiro Onodera , Maxwell G. Anderson , Peter L. McMahon

分类：机器学习

2022-07-27

光学成像通常用于行业和学术界的科学和技术应用。在图像传感中，通过数字化图像的计算分析来执行一个测量，例如对象的位置。新兴的图像感应范例通过设计光学组件来执行不进行成像而是编码，从而打破了数据收集和分析之间的描述。通过将图像光学地编码为适合有效分析后的压缩，低维的潜在空间，这些图像传感器可以以更少的像素和更少的光子来工作，从而可以允许更高的直通量，较低的延迟操作。光学神经网络（ONNS）提供了一个平台，用于处理模拟，光学域中的数据。然而，基于ONN的传感器仅限于线性处理，但是非线性是深度的先决条件，而多层NNS在许多任务上的表现都大大优于浅色。在这里，我们使用商业图像增强器作为平行光电子，光学到光学非线性激活函数，实现用于图像传感的多层预处理器。我们证明，非线性ONN前处理器可以达到高达800：1的压缩率，同时仍然可以在几个代表性的计算机视觉任务中高精度，包括机器视觉基准测试，流程度图像分类以及对对象中对象的识别，场景。在所有情况下，我们都会发现ONN的非线性和深度使其能够胜过纯线性ONN编码器。尽管我们的实验专门用于ONN传感器的光线图像，但替代ONN平台应促进一系列ONN传感器。这些ONN传感器可能通过在空间，时间和/或光谱尺寸中预处处理的光学信息来超越常规传感器，并可能具有相干和量子质量，所有这些都在光学域中。

translated by 谷歌翻译