本文解决了视频检测问题的视频监视问题。由于异常事件的固有稀有性和异质性,该问题被视为一种正态建模策略,在这种策略中,我们的模型学习以对象为中心的正常模式,而无需在训练过程中看到异常样本。主要贡献在于耦合预处理的对象级动作具有基于余弦的异常估计功能的原型原型,因此通过向基于主流重建的策略引入其他约束来扩展以前的方法。我们的框架利用外观和运动信息来学习对象级别的行为并捕获内存模块中的原型模式。在几个知名数据集上进行的实验证明了我们方法的有效性,因为它在最相关的时空评估指标上优于当前的最新时间。
translated by 谷歌翻译
Valuing mineral assets is a challenging task that is highly dependent on the supply (geological) uncertainty surrounding resources and reserves, and the uncertainty of demand (commodity prices). In this work, a graph-based reasoning, modeling and solution approach is proposed to jointly address mineral asset valuation and mine plan scheduling and optimization under supply and demand uncertainty in the "mining complex" framework. Three graph-based solutions are proposed: (i) a neural branching policy that learns a block-sampling ore body representation, (ii) a guiding policy that learns to explore a heuristic selection tree, (iii) a hyper-heuristic that manages the value/supply chain optimization and dynamics modeled as a graph structure. Results on two large-scale industrial mining complexes show a reduction of up to three orders of magnitude in primal suboptimality, execution time, and number of iterations, and an increase of up to 40% in the mineral asset value.
translated by 谷歌翻译
Channel charting (CC) is an unsupervised learning method allowing to locate users relative to each other without reference. From a broader perspective, it can be viewed as a way to discover a low-dimensional latent space charting the channel manifold. In this paper, this latent modeling vision is leveraged together with a recently proposed location-based beamforming (LBB) method to show that channel charting can be used for mapping channels in space or frequency. Combining CC and LBB yields a neural network resembling an autoencoder. The proposed method is empirically assessed on a channel mapping task whose objective is to predict downlink channels from uplink channels.
translated by 谷歌翻译
在过去的几年中,卷积神经网络(CNN)在各种现实世界的网络安全应用程序(例如网络和多媒体安全)中表现出了有希望的性能。但是,CNN结构的潜在脆弱性构成了主要的安全问题,因此不适合用于以安全为导向的应用程序,包括此类计算机网络。保护这些体系结构免受对抗性攻击,需要使用挑战性攻击的安全体系结构。在这项研究中,我们提出了一种基于合奏分类器的新型体系结构,该结构将1级分类(称为1C)的增强安全性与在没有攻击的情况下的传统2级分类(称为2C)的高性能结合在一起。我们的体系结构称为1.5级(Spritz-1.5c)分类器,并使用最终密度分类器,一个2C分类器(即CNNS)和两个并行1C分类器(即自动编码器)构造。在我们的实验中,我们通过在各种情况下考虑八次可能的对抗性攻击来评估我们提出的架构的鲁棒性。我们分别对2C和Spritz-1.5c体系结构进行了这些攻击。我们研究的实验结果表明,I-FGSM攻击对2C分类器的攻击成功率(ASR)是N-Baiot数据集训练的2C分类器的0.9900。相反,Spritz-1.5C分类器的ASR为0.0000。
translated by 谷歌翻译
最近,神经场景表征在视觉上为3D场景提供了令人印象深刻的结果,但是,他们的研究和进步主要仅限于计算机图形或计算机视觉中的虚拟模型的可视化,而无需明确考虑传感器和构成不确定性的情况。但是,在机器人技术应用程序中使用这种新颖的场景表示形式,需要考虑神经图中这种不确定性。因此,本文的目的是提出一种新的方法,用于使用不确定的培训数据训练{\ em概率的神经场景表示},这可以使这些表示形式纳入机器人技术应用中。使用相机或深度传感器获取图像包含固有的不确定性,此外,用于学习3D模型的相机姿势也不完美。如果这些测量值用于训练而无需考虑其不确定性,则结果模型是非最佳的,并且所得场景表示可能包含诸如Blur和Un-Cheven几何形状之类的伪影。在这项工作中,通过以概率方式专注于不确定信息的培训来研究与学习过程的不确定性整合问题。所提出的方法涉及以不确定性项的明确增加训练可能性,以使网络的学习概率分布相对于培训不确定性最小化。可以证明,除了更精确和一致的几何形状外,这还导致更准确的图像渲染质量。对合成数据集和真实数据集进行了验证,表明所提出的方法的表现优于最先进的方法。结果表明,即使训练数据受到限制,该提出的方法也能够呈现新颖的高质量视图。
translated by 谷歌翻译
在过去的几十年中,人工智能的兴起使我们有能力解决日常生活中最具挑战性的问题,例如癌症的预测和自主航行。但是,如果不保护对抗性攻击,这些应用程序可能不会可靠。此外,最近的作品表明,某些对抗性示例可以在不同的模型中转移。因此,至关重要的是避免通过抵抗对抗性操纵的强大模型进行这种可传递性。在本文中,我们提出了一种基于特征随机化的方法,该方法抵抗了八次针对测试阶段深度学习模型的对抗性攻击。我们的新方法包括改变目标网络分类器中的训练策略并选择随机特征样本。我们认为攻击者具有有限的知识和半知识条件,以进行最普遍的对抗性攻击。我们使用包括现实和合成攻击的众所周知的UNSW-NB15数据集评估了方法的鲁棒性。之后,我们证明我们的策略优于现有的最新方法,例如最强大的攻击,包括针对特定的对抗性攻击进行微调网络模型。最后,我们的实验结果表明,我们的方法可以确保目标网络并抵抗对抗性攻击的转移性超过60%。
translated by 谷歌翻译
联合学习(FL)是分散机器学习的新型框架。由于FL的分散特征,它很容易受到训练程序中的对抗攻击的影响,例如,后门攻击。后门攻击旨在将后门注入机器学习模型中,以便该模型会在测试样本上任意使用一些特定的后门触发器。即使已经引入了一系列FL的后门攻击方法,但也有针对它们进行防御的方法。许多捍卫方法都利用了带有后门的模型的异常特征,或带有后门和常规模型的模型之间的差异。为了绕过这些防御,我们需要减少差异和异常特征。我们发现这种异常的来源是,后门攻击将在中毒数据时直接翻转数据标签。但是,当前对FL后门攻击的研究并不主要集中在减少带有后门和常规模型的模型之间的差异。在本文中,我们提出了对抗性知识蒸馏(ADVKD),一种方法将知识蒸馏与FL中的后门攻击结合在一起。通过知识蒸馏,我们可以减少标签翻转导致模型中的异常特征,因此该模型可以绕过防御措施。与当前方法相比,我们表明ADVKD不仅可以达到更高的攻击成功率,而且还可以在其他方法失败时成功绕过防御。为了进一步探索ADVKD的性能,我们测试参数如何影响不同情况下的ADVKD的性能。根据实验结果,我们总结了如何在不同情况下调整参数以获得更好的性能。我们还使用多种方法可视化不同攻击的效果并解释Advkd的有效性。
translated by 谷歌翻译
联合学习(FL)被认为是分布式机器学习(ML)最有前途的解决方案之一。在当前的大多数文献中,FL已被研究用于监督的ML任务,其中边缘设备收集标记的数据。然而,在许多应用中,假设存在跨设备标记的数据是不切实际的。为此,我们开发了一种新颖的方法论,合作联合无监督的对比度学习(CF-CL),用于使用未标记的数据集的跨越边缘设备的FL。 CF-CL采用本地设备合作,其中通过设备到设备(D2D)通信在设备之间进行数据交换,以避免由非独立且相同分布式(非I.I.I.I.D。)本地数据集引起的本地模型偏差。 CF-CL引入了针对无监督的FL设置量身定制的推动力智能数据共享机制,在该设置中,每个设备将其本地数据点的子集推向其邻居,作为保留数据点,并从其邻居中提取一组数据点,并通过其进行采样概率重要性抽样技术。我们证明,CF-CL导致(i)跨设备的无监督的潜在空间对齐,(ii)更快的全局收敛,允许较低的全局模型聚合; (iii)在极端非i.i.d中有效。跨设备的数据设置。
translated by 谷歌翻译
环境感知是自动驾驶汽车领域中的一个重要方面,它提供了有关驾驶领域的重要信息,包括但不限于确定明确的驾驶区域和周围的障碍。语义分割是一种用于自动驾驶汽车的广泛使用的感知方法,它将图像的每个像素与预定义的类相关联。在这种情况下,评估了有关准确性和效率的几个分割模型。生成数据集的实验结果确认,更快的分割模型足够快,可以实时在自动驾驶汽车中的低力计算(嵌入式)设备上使用。还引入了一种简单的方法来为模型生成合成训练数据。此外,比较了第一人称视角的准确性和鸟类的视角。对于第一人称视角的$ 320 \ times 256 $输入,更宽松的是$ 65.44 \,\%$均值均值的交叉点(miou),以及$ 320 \ times 256 $的输入,从鸟类的眼睛的角度来看,forppective fore fore fore fore fore fore foreveves foreveves fore fore fore fore for。 \,\%$ miou。这两种观点都在Nvidia Jetson Agx Xavier上达到每秒247.11美元的框架率。最后,测量并比较目标硬件的算术速率和相对于算术16位浮点(FP16)和32位浮点(FP32)的精度。
translated by 谷歌翻译
我们提出了一种新型的量子算法,用于相对于状态空间大小的对数估算肌关系时间的吉布斯分区函数。这是\ v {s} tefankovi \ v {c},vempala和vigoda [jacm,2009]的\ v {s} tefankovi \ v {c}的开创性近线性时间算法获得的第一种加速。我们的结果还通过利用量子马尔可夫链的特性来保留在先前工作中获得的二次加速和光谱差距。作为一个应用程序,我们获得了用于计算ISING模型分区功能的最著名算法的新多项式改进,并计算出$ K $ - 色,匹配或独立集的图。我们的方法依赖于开发量子相和幅度估计算法的新变体,这些变体返回几乎无偏的估计,而没有破坏其初始量子状态。我们将这些子例程扩展到几乎无偏的量子平均估计量,该估计量比经典的经验平均值更快地降低方差。在我们的工作之前,不存在这种估计量。这些具有普遍兴趣的属性会导致在计算分区函数的模拟退火范围内获得更好的收敛保证。
translated by 谷歌翻译