智能论文笔记

Data Leakage via Access Patterns of Sparse Features in Deep Learning-based Recommendation Systems

Hanieh Hashemi , Wenjie Xiong , Liu Ke , Kiwan Maeng , Murali Annavaram , G. Edward Suh , Hsien-Hsin S. Lee

分类：机器学习

2022-12-12

Online personalized recommendation services are generally hosted in the cloud where users query the cloud-based model to receive recommended input such as merchandise of interest or news feed. State-of-the-art recommendation models rely on sparse and dense features to represent users' profile information and the items they interact with. Although sparse features account for 99% of the total model size, there was not enough attention paid to the potential information leakage through sparse features. These sparse features are employed to track users' behavior, e.g., their click history, object interactions, etc., potentially carrying each user's private information. Sparse features are represented as learned embedding vectors that are stored in large tables, and personalized recommendation is performed by using a specific user's sparse feature to index through the tables. Even with recently-proposed methods that hides the computation happening in the cloud, an attacker in the cloud may be able to still track the access patterns to the embedding tables. This paper explores the private information that may be learned by tracking a recommendation model's sparse feature access patterns. We first characterize the types of attacks that can be carried out on sparse features in recommendation models in an untrusted cloud, followed by a demonstration of how each of these attacks leads to extracting users' private information or tracking users by their behavior over time.

translated by 谷歌翻译

DarKnight: An Accelerated Framework for Privacy and Integrity Preserving Deep Learning Using Trusted Hardware

Hanieh Hashemi , Yongqin Wang , Murali Annavaram

分类：机器学习

2022-06-30

随着机器学习到达不同的应用领域，与隐私和安全有关的问题正在越来越大。数据持有人希望在利用云中托管的加速器（例如GPU）的同时训练或推断私人数据。云系统容易受到损害数据隐私和计算完整性的攻击者的影响。应对这样的挑战需要将理论隐私算法统一使用硬件安全功能。本文介绍了Darknight，这是一个大型DNN培训的框架，同时保护输入隐私和计算完整性。 Darknight依赖于受信任的执行环境（TEE）和加速器之间的合作执行，其中TEE提供了隐私和完整性验证，而加速器则执行大部分线性代数计算以优化性能。特别是，Darknight使用基于矩阵掩码的自定义数据编码策略来在TEE中创建输入混淆。然后将混淆的数据卸载到GPU，以进行快速线性代数计算。 Darknight的数据混淆策略在云服务器中提供了可证明的数据隐私和计算完整性。虽然先前的作品应对推理隐私，并且不能用于培训，但Darknight的编码方案旨在支持培训和推理。

translated by 谷歌翻译

Attribute Inference Attack of Speech Emotion Recognition in Federated Learning Settings

Tiantian Feng , Hanieh Hashemi , Rajat Hebbar , Murali Annavaram , Shrikanth S. Narayanan

分类：机器学习

2021-12-26

语音情感识别（SER）处理语音信号以检测和表征表达的感知情绪。许多SER应用系统经常获取和传输在客户端收集的语音数据，以远程云平台进行推理和决策。然而，语音数据不仅涉及在声乐表达中传达的情绪，而且还具有其他敏感的人口特征，例如性别，年龄和语言背景。因此，塞尔系统希望能够在防止敏感和人口统计信息的意外/不正当推论的同时对情感构建进行分类的能力。联合学习（FL）是一个分布式机器学习范例，其协调客户端，以便在不共享其本地数据的情况下协同培训模型。此培训方法似乎是安全的，可以提高SER的隐私。然而，最近的作品表明，流动方法仍然容易受到重建攻击和会员推论攻击等各种隐私攻击的影响。虽然这些大部分都集中在计算机视觉应用程序上，但是使用FL技术训练的SER系统中存在这种信息泄漏。为了评估使用FL培训的SER系统的信息泄漏，我们提出了一个属性推理攻击框架，其分别涉及来自共享梯度或模型参数的客户端的敏感属性信息，分别对应于FEDSGD和FADAVG训练算法。作为一种用例，我们使用三个SER基准数据集来统一地评估我们预测客户的性别信息的方法：IEMocap，Crema-D和MSP-EXPLA。我们表明，使用FL培训的SER系统可实现属性推理攻击。我们进一步确定大多数信息泄漏可能来自SER模型中的第一层。

translated by 谷歌翻译

Runtime Monitoring for Out-of-Distribution Detection in Object Detection Neural Networks

Vahid Hashemi , Jan Křetínsky , Sabine Rieder , Jessica Schmidt

分类：机器学习

2022-12-15

Runtime monitoring provides a more realistic and applicable alternative to verification in the setting of real neural networks used in industry. It is particularly useful for detecting out-of-distribution (OOD) inputs, for which the network was not trained and can yield erroneous results. We extend a runtime-monitoring approach previously proposed for classification networks to perception systems capable of identification and localization of multiple objects. Furthermore, we analyze its adequacy experimentally on different kinds of OOD settings, documenting the overall efficacy of our approach.

translated by 谷歌翻译

Backdoor Mitigation in Deep Neural Networks via Strategic Retraining

Akshay Dhonthi , Ernst Moritz Hahn , Vahid Hashemi

分类：机器学习

2022-12-14

Deep Neural Networks (DNN) are becoming increasingly more important in assisted and automated driving. Using such entities which are obtained using machine learning is inevitable: tasks such as recognizing traffic signs cannot be developed reasonably using traditional software development methods. DNN however do have the problem that they are mostly black boxes and therefore hard to understand and debug. One particular problem is that they are prone to hidden backdoors. This means that the DNN misclassifies its input, because it considers properties that should not be decisive for the output. Backdoors may either be introduced by malicious attackers or by inappropriate training. In any case, detecting and removing them is important in the automotive area, as they might lead to safety violations with potentially severe consequences. In this paper, we introduce a novel method to remove backdoors. Our method works for both intentional as well as unintentional backdoors. We also do not require prior knowledge about the shape or distribution of backdoors. Experimental evidence shows that our method performs well on several medium-sized examples.

translated by 谷歌翻译

SCGG: A Deep Structure-Conditioned Graph Generative Model

Faezeh Faez , Negin Hashemi Dijujin , Mahdieh Soleymani Baghshah , Hamid R. Rabiee

分类：机器学习 | 人工智能

2022-09-20

基于深度学习的图生成方法具有显着的图形数据建模能力，从而使它们能够解决广泛的现实世界问题。使这些方法能够在生成过程中考虑不同的条件，甚至通过授权它们生成满足所需标准的新图形样本来提高其有效性。本文提出了一种条件深图生成方法，称为SCGG，该方法考虑了特定类型的结构条件。具体而言，我们提出的SCGG模型采用初始子图，并自动重新收获在给定条件子结构之上生成新节点及其相应的边缘。 SCGG的体系结构由图表表示网络和自动回归生成模型组成，该模型是端到端训练的。使用此模型，我们可以解决图形完成，这是恢复缺失的节点及其相关的部分观察图的猖and固有的困难问题。合成数据集和现实世界数据集的实验结果证明了我们方法的优势与最先进的基准相比。

translated by 谷歌翻译

Learning to Improve Code Efficiency

Binghong Chen , Daniel Tarlow , Kevin Swersky , Martin Maas , Pablo Heiber , Ashish Naik , Milad Hashemi , Parthasarathy Ranganathan

分类：机器学习

2022-08-09

由摩尔定律驱动的计算系统性能的改善已改变了社会。由于这种硬件驱动的收益放缓，对于软件开发人员而言，专注于开发过程中的性能和效率变得更加重要。尽管几项研究表明了这种提高的代码效率的潜力（例如，与硬件相比，2倍更好的世代改进），但在实践中解锁这些收益是充满挑战的。关于算法复杂性以及硬件编码模式的相互作用的推理对于普通程序员来说可能是具有挑战性的，尤其是当与围绕开发速度和多人发展的务实约束结合使用时。本文旨在解决这个问题。我们分析了Google Code JAM竞争中的大型竞争编程数据集，并发现有效的代码确实很少见，中位数和第90％的解决方案之间的运行时间差异为2倍。我们建议使用机器学习以提示的形式自动提供规范反馈，以指导程序员编写高性能代码。为了自动从数据集中学习这些提示，我们提出了一种新颖的离散变异自动编码器，其中每个离散的潜在变量代表了不同的代码编辑类别，从而提高了性能。我们表明，此方法代表代码效率的多模式空间比序列到序列基线更好地编辑，并生成更有效的解决方案的分布。

translated by 谷歌翻译

Scalable Polar Code Construction for Successive Cancellation List Decoding: A Graph Neural Network-Based Approach

Yun Liao , Seyyed Ali Hashemi , Hengjie Yang , John M. Cioffi

分类：人工智能

2022-07-03

虽然可以通过对位渠道进行排序来有效地实现连续策略解码的极性代码，但以有效且可扩展的方式为连续策略列表（SCL）解码找到最佳的极性代码结构，但仍在等待研究。本文提出了一个基于图形神经网络（GNN）基于迭代消息通话（IMP）算法的强化算法，以解决SCL解码的极性代码构建问题。该算法仅在极地代码的生成器矩阵诱导的图的局部结构上运行。 IMP模型的大小独立于区块长度和代码速率，从而使其可扩展到具有长块长度的极性代码。此外，单个受过训练的IMP模型可以直接应用于广泛的目标区块长度，代码速率和渠道条件，并且可以生成相应的极性代码，而无需单独的训练。数值实验表明，IMP算法找到了极性代码构建体，这些构建体在环状划分 - 检查辅助辅助AD的SCL（CA-SCL）解码下显着优于经典构建体。与针对SCL/CA-SCL解码量身定制的其他基于学习的施工方法相比，IMP算法构建具有可比或较低帧错误率的极地代码，同时通过消除每个目标阻止长度的单独训练的需求，从而大大降低了训练的复杂性，代码速率和通道状况。

translated by 谷歌翻译

LPF-Defense: 3D Adversarial Defense based on Frequency Analysis

Hanieh Naderi , Kimia Noorbakhsh , Arian Etemadi , Shohreh Kasaei

分类：计算机视觉 | 机器学习

2022-02-23

尽管最近在不同的应用程序方案中广泛部署了3D点云分类，但它仍然非常容易受到对抗攻击的影响。面对对抗性攻击，这增加了对3D模型的强大训练的重要性。基于我们对现有对抗性攻击的性能的分析，在输入数据的中和高频组件中发现了更多的对抗性扰动。因此，通过抑制训练阶段的高频含量，改善了针对对抗性示例的模型。实验表明，提出的防御方法降低了对PointNet，PointNet ++和DGCNN模型的六次攻击的成功率。特别是，与最先进的方法相比，Drop100攻击的平均分类精度在Drop100攻击中平均提高3.8％，而Drop200攻击的平均分类精度提高了3.8％。与其他可用方法相比，该方法还提高了原始数据集的模型精度。

translated by 谷歌翻译

Analyzing a Caching Model

Leon Sixt , Evan Zheran Liu , Marie Pellat , James Wexler , Milad Hashemi Been Kim , Martin Maas

分类：机器学习

2021-12-13

机器学习已成功应用于系统应用程序（如内存预取和缓存），其中已知模型已显示出优于HeuRistics。然而，缺乏了解这些模型的内部工作 - 可解释性 - 仍然是在现实世界部署中采用的主要障碍。了解模型的行为可以帮助系统管理员，开发人员在模型中获得信心，了解生产中的风险和调试意外行为。计算机系统中使用的模型的可解释性构成了特定的挑战：与在图像或文本上培训的ML模型不同，输入域（例如，内存访问模式，程序计数器）不是立即解释的。因此，一项重大挑战是在对人类从业者达成的概念方面解释该模型。通过分析最先进的高速缓存模型，我们提供了证据表明该模型已经学习超出可以利用解释的简单统计数据的概念。我们的工作为系统ML模型的解读提供了第一步，并突出了这一新兴研究区域的承诺和挑战。

translated by 谷歌翻译