Online personalized recommendation services are generally hosted in the cloud where users query the cloud-based model to receive recommended input such as merchandise of interest or news feed. State-of-the-art recommendation models rely on sparse and dense features to represent users' profile information and the items they interact with. Although sparse features account for 99% of the total model size, there was not enough attention paid to the potential information leakage through sparse features. These sparse features are employed to track users' behavior, e.g., their click history, object interactions, etc., potentially carrying each user's private information. Sparse features are represented as learned embedding vectors that are stored in large tables, and personalized recommendation is performed by using a specific user's sparse feature to index through the tables. Even with recently-proposed methods that hides the computation happening in the cloud, an attacker in the cloud may be able to still track the access patterns to the embedding tables. This paper explores the private information that may be learned by tracking a recommendation model's sparse feature access patterns. We first characterize the types of attacks that can be carried out on sparse features in recommendation models in an untrusted cloud, followed by a demonstration of how each of these attacks leads to extracting users' private information or tracking users by their behavior over time.
translated by 谷歌翻译
联合学习(FL)旨在对多个数据所有者持有的分布式数据执行隐私的机器学习。为此,FL要求数据所有者在本地执行培训,并与中央服务器共享梯度更新(而不是私人输入),然后将其安全地汇总在多个数据所有者上。尽管汇总本身并不能证明提供隐私保护,但先前的工作表明,如果批处理大小足够大,则足够了。在本文中,我们提出了鸡尾酒会攻击(CPA),与先前的信念相反,能够从汇总的渐变中恢复私人输入,这是批量较大的大小。 CPA利用了至关重要的见解,即来自完全连接的层的总梯度是其输入的线性组合,这使我们将梯度反演作为盲源分离(BSS)问题(非正式地称为鸡尾酒会问题)。我们适应独立的组件分析(ICA) - BSS问题的经典解决方案 - 恢复针对完全连接和卷积网络的私人输入,并表明CPA明显优于先前的梯度反转攻击,对成像网的输入量表,并表现出Imagenet大小的输入的范围最高可达1024的大批量。
translated by 谷歌翻译
神经网络稳健性近年来已成为机器学习中的核心主题。大多数培训算法,提高模型对抗对抗和共同腐败的鲁棒性也引入了大的计算开销,需要向前和后向往的数量和后向往的多达十倍以便收敛。为了打击这种低效率,我们提出了Bullettrain $ - $界限示例挖掘技术,以大大降低强大培训的计算成本。我们的主要观察是,只有一小部分的例子是有利于改善稳健性的有益。Bullettrain动态预测了这些重要的例子,并优化了强大的培训算法,专注于重要例子。我们将技术应用于几个现有的强大培训算法,在CiFar-10和Cifar-10-C和CiFar上的Augmix上获得了2.1美元\ Times $ 10.7 $ \ times $ Scase-Up。100-C没有任何清洁和稳健的准确性。
translated by 谷歌翻译
多限制攀岩机器人的运动计划必须考虑机器人的姿势,联合扭矩,以及它如何使用接触力与环境相互作用。本文着重于使用非传统运动来探索不可预测的环境(例如火星洞穴)的机器人运动计划。我们的机器人概念Reachbot使用可扩展和可伸缩的动臂作为四肢,在攀爬时实现了大型可伸缩度工作区。每个可扩展的动臂都由旨在抓住岩石表面的微生物抓地力封顶。 Reachbot利用其大型工作空间来绕过障碍物,裂缝和挑战地形。我们的计划方法必须具有多功能性,以适应可变的地形特征和鲁棒性,以减轻用刺抓握随机性质的风险。在本文中,我们引入了一种图形遍历算法,以根据适用于握把的可用地形特征选择一个离散的grasps序列。该离散的计划是由一个解耦运动计划者互补的,该计划者使用基于抽样的计划和顺序凸面编程的组合来考虑身体运动和最终效应器运动的交替阶段,以优化单个阶段。我们使用运动规划师在模拟的2D洞穴环境中计划轨迹,至少有95%的成功概率,并在基线轨迹上表现出改善的鲁棒性。最后,我们通过对2D平面原型进行实验来验证运动计划算法。
translated by 谷歌翻译
拆分学习和推理建议运行跨客户设备和云的大型模型的培训/推理。但是,这样的模型拆分引起了隐私问题,因为流过拆分层的激活可能会泄漏有关客户端私人输入数据的信息。当前,没有一个好方法可以量化通过分层泄漏多少私人信息,也没有一种将隐私提高到所需级别的好方法。在这项工作中,我们建议将Fisher信息用作隐私指标来衡量和控制信息泄漏。我们表明,Fisher信息可以直观地理解以无偏重建攻击者的限制的错误形式通过拆分层泄漏了多少私人信息。然后,我们提出了一种增强隐私的技术REFIL,可以在拆分层上强制使用用户呈现的Fisher信息泄漏,以实现高隐私,同时保持合理的实用程序。
translated by 谷歌翻译
我们提出了GAAF(一种广义自动解剖器查找器),用于鉴定3D CT扫描中的通用解剖位置。GAAF是端到端管道,具有专用模块用于数据预处理,模型培训和推理。GAAF以核心使用自定义卷积神经网络(CNN)。CNN型号很小,轻巧,可以调整以适合特定应用。到目前为止,GAAF框架已经在头部和颈部进行了测试,并且能够找到解剖位置,例如脑干的质量中心。GAAF在开放式数据集中进行了评估,并且能够准确稳健地定位性能。我们所有的代码都是开源的,可在https://github.com/rrr-uom-projects/gaaf上找到。
translated by 谷歌翻译
腹部器官分割是一项艰巨且耗时的任务。为了减轻临床专家的负担,非常需要完全自动化的方法。当前的方法由卷积神经网络(CNN)主导,但是计算要求和对大数据集的需求限制了其在实践中的应用。通过实施小而高效的自定义3D CNN,编译训练的模型并优化计算图:我们的方法可产生高精度分割(骰子相似性系数(%):肝脏:97.3 $ \ pm 1.3,肾脏:94.8 $ \ pm $ 3.6,$ 3.6,,$ 3.6,,$ 3.6,,,$ 3.6,,,$ 3.6,,,$ 3.6,,$ \ pm $ 3.6,,肝气脾脏:96.4 $ \ pm $ 3.0,pancreas:80.9 $ \ pm $ 10.1),每张图像1.6秒。至关重要的是,我们能够仅在CPU上执行细分推断(无需GPU),从而在没有专家硬件的情况下便利地促进模型的简单和广泛部署。
translated by 谷歌翻译
使用卷积神经网络(CNNS)自动分割CT扫描中的器官 - AT风险(OARS),正在放疗工作流中。但是,这些细分仍需要在临床使用前进行临床医生的手动编辑和批准,这可能很耗时。这项工作的目的是开发一种工具,以自动识别3D OAR细分中的错误,而无需基础真相。我们的工具使用了结合CNN和图神经网络(GNN)的新型体系结构来利用分割的外观和形状。使用合成生成的腮腺分割数据集并使用逼真的轮廓错误的数据集对所提出的模型进行训练。通过消融测试评估我们的模型的有效性,评估了体系结构不同部分的功效,以及从无监督的借口任务中使用转移学习。我们最佳性能模型预测了腮腺上的错误,内部和外部错误的精度分别为85.0%和89.7%,召回66.5%和68.6%。该离线质量检查工具可以在临床途径中使用,有可能减少临床医生通过检测需要注意的区域来纠正轮廓的时间。我们所有的代码均可在https://github.com/rrr-uom-projects/contour_auto_qatool上公开获得。
translated by 谷歌翻译
激光粉末融合期间的局部热史(LPBF)过程中的局部热历史的变化可以引起微孔缺陷。已经提出了原位传感来监测AM过程以最大限度地减少缺陷,但成功需要在感测数据和孔隙率之间建立定量关系,这对于大量变量和计算昂贵尤其具有挑战性。在这项工作中,我们开发了机器学习(ML)型号,可以使用原位热度显数据来预测LPBF不锈钢材料的微孔。这项工作考虑了来自热历史的两个识别的关键特征:高于表观熔化阈值(/ TAU)和最大辐射(T_ {MAX})的时间。计算这些功能,为每个体素存储在内置材料中,用作输入。每个体素的二进制状态,无缺陷或正常,是输出。针对二进制分类任务培训并测试不同的ML模型。除了使用每个体素的热特征来预测其自己的状态之外,还包括相邻体素的热特征作为输入。这被示出了提高预测精度,这与各个体素周围的热传输物理符合其最终状态。在培训的模型中,试验组上的F1分数达到0.96,对于随机森林。基于ML模型的特征重要性分析表明T_ {MAX}对Voxel州比/ Tau更重要。分析还发现本发明体素上方的体素的热历史比它下方的血管素更有影响力。
translated by 谷歌翻译
While the capabilities of autonomous systems have been steadily improving in recent years, these systems still struggle to rapidly explore previously unknown environments without the aid of GPS-assisted navigation. The DARPA Subterranean (SubT) Challenge aimed to fast track the development of autonomous exploration systems by evaluating their performance in real-world underground search-and-rescue scenarios. Subterranean environments present a plethora of challenges for robotic systems, such as limited communications, complex topology, visually-degraded sensing, and harsh terrain. The presented solution enables long-term autonomy with minimal human supervision by combining a powerful and independent single-agent autonomy stack, with higher level mission management operating over a flexible mesh network. The autonomy suite deployed on quadruped and wheeled robots was fully independent, freeing the human supervision to loosely supervise the mission and make high-impact strategic decisions. We also discuss lessons learned from fielding our system at the SubT Final Event, relating to vehicle versatility, system adaptability, and re-configurable communications.
translated by 谷歌翻译