使用深度神经网络的图像分类通常限于小维度的图像,例如Resnet模型中的224x244。此限制不包括现代智能手机摄像头和智能设备拍摄的4000x3000尺寸图像。在这项工作中,我们的目标是减轻在如此大的维度空间中运行的禁止推理和内存成本。为了从高分辨率原始输入分布中进行采样,我们建议使用较小的代理分布来学习与高维空间中的感兴趣区域相对应的坐标。我们引入了一个新的原理变分下界,它捕获了代理分布的后验和原始图像的坐标空间之间的关系,最大化了条件分类可能性。我们凭经验证明了一个合成基准和一个真实世界的大分辨率DSLRcamera图像数据集,我们的方法可以产生与10xfaster推理相比较的结果,并且比使用原始输入分布的模型具有更低的内存消耗。
translated by 谷歌翻译
由于材料弹性性质建模的复杂性,机器学习算法的使用对于触觉传感应用而言不断增加。应用计算机视觉的深度神经网络的最新进展使基于视觉的触觉传感器非常有吸引力,因为它们具有高分辨率和相对低的成本。本文介绍了一种可以在任意形状的大表面上发布的柔软光学触觉传感器。 Asupervised学习算法训练一个模型,该模型能够重建传感器表面上的正常力分布,纯粹来自内部摄像机记录的图像。为了减少训练时间和大数据集的需要,提出了一种校准程序,用于在多个传感器之间传输获得的知识,同时保持令人满意的性能。
translated by 谷歌翻译
我们提出了一种新型的后门攻击,它利用了先前未经研究的卷积神经网络(CNN)的漏洞。特别是,我们研究了面部识别的应用。深度学习技术是面部识别游戏的首选,这意味着它们现在已经在许多生产级系统中实现。令人担忧的是,与操作系统和网络设备等其他商业技术不同,基于深度学习的面部识别算法目前尚未设计为具有安全要求或在部署之前针对安全漏洞进行审计。鉴于技术的年轻程度以及这些算法的许多内部工作方式的抽象程度,基于神经网络的面部识别系统是安全漏洞的主要目标。随着越来越多的个人信息开始受到面部识别(例如iPhone X)的保护,从渗透测试角度探索这些系统的安全漏洞至关重要。在这些方面,我们描述了通过目标体重扰动来回归CNN的通用方法。使用五层CNN和ResNet-50作为案例研究,我们证明攻击者能够显着增加他们提供的输入将被错误地接受的机会。 CNN同时保留合法登记类的错误率。
translated by 谷歌翻译
机器游戏测试工具和游戏时刻搜索引擎需要接触游戏状态空间的多样性,如果他们要报告或索引最有趣的可能游戏时刻。同时,移动应用程序分发服务希望快速确定新上传的游戏是否适合发布。访问游戏中可达状态的语义映射将在这些应用程序中实现有效推断。然而,相对于它所提供的游戏的覆盖范围而言,人类gameplaydata的获取是昂贵的。我们展示了现成的自动探索策略,它可以在相同的时间尺度上与人类游戏玩法相媲美。我们提供通用方法来量化探索质量作为时间的函数,并展示我们对从多个游戏平台(从Atari 2600到Nintendo 64)采集的商业游戏集合中的几种基本技术和人类玩家的度量。强调所达到的状态的多样性和提取的语义地图,这项工作与重点在于寻找行为政策或优化在大多数自动游戏研究中使用的游戏得分进行有效对比。
translated by 谷歌翻译
在实际应用中,获得标记的示例通常是昂贵且耗时的。在这种情况下,从标签丰富的相关域转移知识可以大大减少对广泛标记工作的需求。在这种情况下,转移学习就在眼前。在本文中,我们提出深度变分传输(DVT),一种变量自动编码,使用共享的潜在高斯混合模型在域之间传递知识。由于半监督ELBO和跨域参数共享的组合,我们能够同时:(i)将同一类的所有监督样本对齐到相同的潜在高斯混合分量中,独立于其域; (ii)预测来自不同领域的非验证样本的类别,并使用它们来更好地模拟发生的振荡。我们对MNIST和USPS数字数据集进行测试,显示DVT跨异构数据集执行传输学习的能力。此外,我们在MNISTsemi监督学习挑战中呈现DVT的最高分类性能。我们在天文数据集上进一步验证了DVT。 DVT实现了最先进的分类性能,在真实的恒星调查数据集,EROS,MACHO和HIT中传递知识。在最糟糕的表现中,我们将rareclasses的F1得分翻倍。这些实验表明DVT能够应对转移学习带来的所有主要挑战:不同的协变量分布,不同的和非常不平衡的类分布以及不同的特征空间。
translated by 谷歌翻译
理想情况下,360 {\ deg}图像可以继承已经在透视投影图像上取得巨大成功训练的深度卷积神经网络(CNN)。然而,从透视tospherical图像转移CNN的现有方法在精度上引入了显着的计算成本和/或降级。在这项工作中,我们提出了核变换器网络(KTN).KTNs有效地将卷积核从透视图像传输到360 {\ deg}图像的所需矩形投影。给定CNN作为输入的源图像CNN,KTN产生由非极角和内核作为输出参数化的函数。给定一个新颖的360 {\ deg}图像,该函数反过来可以计算任意层和内核的卷积,就像在相应的切平面投影上的源CNN一样。与allexisting方法不同,KTN允许模型转移:相同的模型可以应用于具有相同基础架构的不同源CNN。这使得能够应用于多个识别任务而无需重新训练KTN。通过多源CNN和数据集验证,我们证明了KTN改进了球形卷积的艺术状态。 KTN成功地保留了CNN的资源准确性,同时提供了可转换性,典型图像分辨率的可扩展性,以及在许多情况下大大降低了内存占用。
translated by 谷歌翻译
我们考虑在动态随机块模型中估计单个变化点的位置的问题。我们提出了两种估计变换点的方法,以及模型参数。第一种方法采用最小二乘准则函数,并考虑随机块模型的完整结构,并在每个时间点进行评估。因此,作为中间步骤,需要在每个时间点基于聚类算法估计社区结构。第二种方法包括以下两个步骤:在第一种方法中,使用最小二乘函数并在每个时间点进行评估,但忽略社区结构并仅考虑表现出变化点的随机图生成机制。一旦识别出变化点,在第二步骤中,将其之前和之后的所有网络数据与聚类算法一起使用以获得相应的社区结构,并随后估计生成随机块模型参数。说明了这两种方法之间的比较。此外,对于在各自可识别性和某些附加规律性条件下的两种方法,我们建立收敛率并导出变化点估计量的渐近分布。结果在合成数据上说明。
translated by 谷歌翻译
量子机器学习具有广泛工业应用的潜力,并且鉴于它们在当今机器学习中发挥的核心作用,用于改善神经网络性能的量子算法的开发尤其令人感兴趣。在本文中,我们提出了基于规范经典前馈和后向传播算法的前馈神经网络的量子算法。我们的算法依赖于有效的量子子程序来近似矢量之间的内积,以及在量子随机存取存储器中存储中间值以便在后期快速检索。我们的算法的运行时间可以比它们的经典算法更快,因为它们线性地依赖于网络中神经元的数量,而不是像经典情况那样的数量。这使我们的算法适用于大规模,高度连接的网络,其中网络中的边缘数量支配经典的算法运行时间。
translated by 谷歌翻译
机器学习模型容易受到依赖于打击输入数据的对抗性攻击。这项工作提出了一种新的策略,使用自动编码器深度神经网络来保护机器学习模型免受基于两种攻击的攻击:快速梯度标志攻击和快速梯度攻击。首先,我们使用自动编码器对测试数据进行去噪,这些数据经过干净和损坏的训练数据。然后,我们使用另一个自动编码器的隐藏层表示来减少去噪数据的维数。我们针对对抗扰动的界限的多个值进行该实验,并考虑不同数量的减小维度。当使用该级联管道对测试数据进行预处理时,测试的深度神经网络分类器产生更高的准确度,从而减轻了对抗扰动的影响。
translated by 谷歌翻译
在本文中,我们使用GAN将颜色恒常性任务表示为图像到图像的翻译问题。通过对不同数据集进行大量实验,提供了使用不同类型的GAN来解决颜色恒定性的实验调查,即CC-GAN(颜色常数GAN)。在实验回顾的基础上,给出了CC设计的建议。 -GAN架构基于不同的标准,环境和数据集。
translated by 谷歌翻译