智能论文笔记

Design and Analysis of Robust Resilient Diffusion over Multi-Task Networks Against Byzantine Attacks

Tao Yu , Rodrigo C. de Lamare , Yi Yu

分类：机器学习

2022-06-25

本文研究了在脉冲干扰和拜占庭式攻击的情况下，对聚类的多任务网络进行了扩散适应。我们根据Geman-McClure估计器使用的成本函数开发了强大的弹性扩散算法（RDLMG）算法，这可以降低对大异常值的敏感性，并使算法在冲动性的干扰下使算法可靠。此外，平均子序列减少的方法，其中每个节点丢弃了从其邻居那里获得的成本贡献的极端价值信息，可以使网络对拜占庭式攻击进行弹性。在这方面，提出的RDLMG算法可确保所有正常节点通过节点之间的合作融合到其理想状态。 RDLMG算法的统计分析也是根据平均和平均形式性能进行的。数值结果评估了用于多目标定位和多任务频谱传感的应用中提出的RDLMG算法。

translated by 谷歌翻译

Study of General Robust Subband Adaptive Filtering

Yi Yu , Hongsen He , Rodrigo C. de Lamare , Badong Chen

分类：机器学习

2022-08-04

在本文中，我们提出了一种一般稳健的子带自适应滤波（GR-SAF）方案，以防止冲动噪声，通过在随机步行模型下以各个重量不确定性最小化均方根偏差。具体而言，通过选择不同的缩放因子，例如在GR-SAF方案中从M-估计和最大correntropy robust标准中选择，我们可以轻松获得不同的GR-SAF算法。重要的是，所提出的GR-SAF算法可以简化为可变的正则化鲁棒归一化的SAF算法，从而具有快速的收敛速率和低稳态误差。在系统识别的背景下，用冲动噪声和回声取消进行双词的模拟已证实，所提出的GR-SAF算法的表现优于其对应物。

translated by 谷歌翻译

Can Competition Outperform Collaboration? The Role of Malicious Agents

Luca Ballotta , Giacomo Como , Jeff S. Shamma , Luca Schenato

分类：机器人

2022-07-04

我们研究了一种新颖的方法，用于在网络控制系统中使用二次成本进行弹性分布式优化的方法，容易出现使代理行为不良的外源性攻击。与普遍采用的过滤策略相反，我们从共识问题的游戏理论表述中汲取灵感，并认为在恶意药物的存在下增加竞争可以提高韧性。分析和数值结果证实了我们的直觉，表明（i）我们的策略揭示了完全协作和全面竞争之间的非平凡性能权衡，（ii）基于竞争的方法可以超越基于平均值的最先进算法子序列减少。最后，我们研究了通信拓扑和连接性对性能的影响，并指出了对强大的网络设计的见解。

translated by 谷歌翻译

Distributed Adaptive Learning Under Communication Constraints

Marco Carpentiero , Vincenzo Matta , Ali H. Sayed

分类：机器学习 | (统计)机器学习

2021-12-03

这项工作审查了旨在在通信约束下运行的自适应分布式学习策略。我们考虑一个代理网络，必须从持续观察流数据来解决在线优化问题。代理商实施了分布式合作策略，其中允许每个代理商与其邻居执行本地信息交换。为了应对通信约束，必须不可避免地压缩交换信息。我们提出了一种扩散策略，昵称为ACTC（适应 - 压缩 - 然后组合），其依赖于以下步骤：i）每个代理执行具有恒定步长大小的单独随机梯度更新的适应步骤; ii）一种压缩步骤，它利用最近引入的随机压缩操作员;和III）每个代理组合从其邻居接收的压缩更新的组合步骤。这项工作的区别要素如下。首先，我们专注于自适应策略，其中常数（而不是递减）阶梯大小对于实时响应非间断变化至关重要。其次，我们考虑一般的指导图表和左随机组合政策，使我们能够增强拓扑和学习之间的相互作用。第三，与对所有个人代理的成本职能承担强大的凸起的相关作品相比，我们只需要在网络水平的强大凸起，即使单个代理具有强凸的成本，剩余的代理商也不满足凸起成本。第四，我们专注于扩散（而不是共识）战略。在压缩信息的苛刻设置下，建立ACTC迭代在所需的优化器周围波动，在相邻代理之间交换的比特方面取得了显着的节省。

translated by 谷歌翻译

Quantization for decentralized learning under subspace constraints

Roula Nassif , Stefan Vlaski , Marco Carpentiero , Vincenzo Matta , Marc Antonini , Ali H. Sayed

分类：机器学习

2022-09-16

在本文中，我们考虑了分散的优化问题，在这些问题中，代理具有个人成本函数，以最大程度地减少受到子空间约束的约束，这些子空间约束需要整个网络的最小化器才能位于低维子空间中。这种约束的公式包括共识或单任务优化作为特殊情况，并允许更一般的任务相关性模型，例如多任务平滑度和耦合优化。为了应对沟通限制，我们提出并研究一种自适应分散策略，在该策略中，代理人在与邻居进行交流之前，使用差异随机量化器来压缩其估计。分析表明，在量化噪声的某些一般条件下，对于足够小的步长$ \ mu $，该策略在均方误差和平均比特率方面都是稳定的：通过减少$ \ mu $，可以将估计错误保持较小（按$ \ mu $）保持较小，而不会无限地增加比特率为$ \ mu \ rightarrow 0 $。模拟说明了理论发现和提议方法的有效性，表明可以实现分散学习，但仅需少量。

translated by 谷歌翻译

A Survey on Over-the-Air Computation

Alphan Sahin , Rui Yang

分类：人工智能

2022-10-20

Communication and computation are often viewed as separate tasks. This approach is very effective from the perspective of engineering as isolated optimizations can be performed. On the other hand, there are many cases where the main interest is a function of the local information at the devices instead of the local information itself. For such scenarios, information theoretical results show that harnessing the interference in a multiple-access channel for computation, i.e., over-the-air computation (OAC), can provide a significantly higher achievable computation rate than the one with the separation of communication and computation tasks. Besides, the gap between OAC and separation in terms of computation rate increases with more participating nodes. Given this motivation, in this study, we provide a comprehensive survey on practical OAC methods. After outlining fundamentals related to OAC, we discuss the available OAC schemes with their pros and cons. We then provide an overview of the enabling mechanisms and relevant metrics to achieve reliable computation in the wireless channel. Finally, we summarize the potential applications of OAC and point out some future directions.

translated by 谷歌翻译

Combinations of Adaptive Filters

Jerónimo Arenas-García , Luis A. Azpicueta-Ruiz , Magno T. M. Silva , Vitor H. Nascimento , Ali H. Sayed

分类：机器学习

2021-12-22

自适应滤波器处于许多信号处理应用的核心，从声噪声繁殖到回声消除，阵列波束形成，信道均衡，以更新的传感器网络应用在监控，目标本地化和跟踪中。沿着该方向的趋势方法是重复到网络内分布式处理，其中各个节点实现适应规则并将它们的估计扩散到网络。当关于过滤方案的先验知识有限或不精确时，选择最适当的过滤器结构并调整其参数变得有挑战性的任务，并且错误的选择可能导致性能不足。为了解决这个困难，一种有用的方法是依赖自适应结构的组合。自适应滤波器的组合在某种程度上利用相同的鸿沟和征服机器学习界（例如，袋装或升级）成功利用的原则。特别地，在不同的视角下，在计算学习领域中研究了组合若干学习算法的输出（专家的混合）：而不是研究混合物的预期性能，衍生出适用于各个序列的确定性范围因此，反映了最糟糕的情况。这些界限需要与通常在自适应滤波中使用的那些不同的假设，这是该概述文章的重点。我们审查了这些组合计划背后的关键思想和原则，重点是设计规则。我们还通过各种示例说明了它们的性能。

translated by 谷歌翻译

Decentralized Nonconvex Optimization with Guaranteed Privacy and Accuracy

Yongqiang Wang , Tamer Basar

分类：机器学习

2022-12-14

Privacy protection and nonconvexity are two challenging problems in decentralized optimization and learning involving sensitive data. Despite some recent advances addressing each of the two problems separately, no results have been reported that have theoretical guarantees on both privacy protection and saddle/maximum avoidance in decentralized nonconvex optimization. We propose a new algorithm for decentralized nonconvex optimization that can enable both rigorous differential privacy and saddle/maximum avoiding performance. The new algorithm allows the incorporation of persistent additive noise to enable rigorous differential privacy for data samples, gradients, and intermediate optimization variables without losing provable convergence, and thus circumventing the dilemma of trading accuracy for privacy in differential privacy design. More interestingly, the algorithm is theoretically proven to be able to efficiently { guarantee accuracy by avoiding} convergence to local maxima and saddle points, which has not been reported before in the literature on decentralized nonconvex optimization. The algorithm is efficient in both communication (it only shares one variable in each iteration) and computation (it is encryption-free), and hence is promising for large-scale nonconvex optimization and learning involving high-dimensional optimization parameters. Numerical experiments for both a decentralized estimation problem and an Independent Component Analysis (ICA) problem confirm the effectiveness of the proposed approach.

translated by 谷歌翻译

Resilient Consensus-based Multi-agent Reinforcement Learning

Martin Figura , Yixuan Lin , Ji Liu , Vijay Gupta

分类：机器学习

2021-11-12

培训期间的对抗性攻击能够强烈影响多功能增强学习算法的性能。因此，非常希望增加现有算法，使得消除对抗对协作网络的对抗性攻击的影响，或者至少有界限。在这项工作中，我们考虑一个完全分散的网络，每个代理商收到本地奖励并观察全球州和行动。我们提出了一种基于弹性共识的演员 - 批评算法，其中每个代理估计了团队平均奖励和价值函数，并将关联的参数向量传送到其立即邻居。我们表明，在拜占庭代理人的存在下，其估算和通信策略是完全任意的，合作社的估计值会融合到有概率一体的有界共识值，条件是在附近的最多有$ H $拜占庭代理商每个合作社和网络都是$（2h + 1）$ - 强大。此外，我们证明，合作社的政策在其团队平均目标函数的局部最大化器周围汇聚在其团队平均目标函数的概率上，这是对渐关节转移变得稳定的普发因子的政策。

translated by 谷歌翻译

Resilient Distributed Optimization for Multi-Agent Cyberphysical Systems

Michal Yemini , Angelia Nedić , Andrea J. Goldsmith , Stephanie Gil

分类：机器人

2022-12-05

Enhancing resilience in distributed networks in the face of malicious agents is an important problem for which many key theoretical results and applications require further development and characterization. This work focuses on the problem of distributed optimization in multi-agent cyberphysical systems, where a legitimate agent's dynamic is influenced both by the values it receives from potentially malicious neighboring agents, and by its own self-serving target function. We develop a new algorithmic and analytical framework to achieve resilience for the class of problems where stochastic values of trust between agents exist and can be exploited. In this case we show that convergence to the true global optimal point can be recovered, both in mean and almost surely, even in the presence of malicious agents. Furthermore, we provide expected convergence rate guarantees in the form of upper bounds on the expected squared distance to the optimal value. Finally, we present numerical results that validate the analytical convergence guarantees we present in this paper even when the malicious agents compose the majority of agents in the network.

translated by 谷歌翻译

BRIDGE: Byzantine-resilient Decentralized Gradient Descent

Cheng Fang , Zhixiong Yang , Waheed U. Bajwa

分类： (统计)机器学习 | 机器学习

2019-08-21

机器学习已开始在许多应用中发挥核心作用。这些应用程序中的许多应用程序通常还涉及由于设计约束（例如多元系统）或计算/隐私原因（例如，在智能手机数据上学习），这些数据集分布在多个计算设备/机器上。这样的应用程序通常需要以分散的方式执行学习任务，其中没有直接连接到所有节点的中央服务器。在现实世界中的分散设置中，由于设备故障，网络攻击等，节点容易出现未发现的故障，这可能会崩溃非稳固的学习算法。本文的重点是在发生拜占庭失败的节点的存在下对分散学习的鲁棒化。拜占庭故障模型允许故障节点任意偏离其预期行为，从而确保设计最健壮的算法的设计。但是，与分布式学习相反，对分散学习中拜占庭式的弹性的研究仍处于起步阶段。特别是，现有的拜占庭式分散学习方法要么不能很好地扩展到大规模的机器学习模型，要么缺乏统计收敛性可确保有助于表征其概括错误。在本文中，引入了一个可扩展的，拜占庭式的分散的机器学习框架，称为拜占庭的分散梯度下降（桥梁）。本文中还提供了强烈凸出问题和一类非凸问题的算法和统计收敛保证。此外，使用大规模的分散学习实验来确定桥梁框架是可扩展的，并且为拜占庭式弹性凸和非convex学习提供了竞争结果。

translated by 谷歌翻译

When Machine Learning Meets Spectrum Sharing Security: Methodologies and Challenges

Qun Wang , Haijian Sun , Rose Qingyang Hu , Arupjyoti Bhuyan

分类：机器学习

2022-01-12

互联网连接系统的指数增长产生了许多挑战，例如频谱短缺问题，需要有效的频谱共享（SS）解决方案。复杂和动态的SS系统可以接触不同的潜在安全性和隐私问题，需要保护机制是自适应，可靠和可扩展的。基于机器学习（ML）的方法经常提议解决这些问题。在本文中，我们对最近的基于ML的SS方法，最关键的安全问题和相应的防御机制提供了全面的调查。特别是，我们详细说明了用于提高SS通信系统的性能的最先进的方法，包括基于ML基于ML的基于的数据库辅助SS网络，ML基于基于的数据库辅助SS网络，包括基于ML的数据库辅助的SS网络，基于ML的LTE-U网络，基于ML的环境反向散射网络和其他基于ML的SS解决方案。我们还从物理层和基于ML算法的相应防御策略的安全问题，包括主要用户仿真（PUE）攻击，频谱感测数据伪造（SSDF）攻击，干扰攻击，窃听攻击和隐私问题。最后，还给出了对ML基于ML的开放挑战的广泛讨论。这种全面的审查旨在为探索新出现的ML的潜力提供越来越复杂的SS及其安全问题，提供基础和促进未来的研究。

translated by 谷歌翻译

Distributed Policy Gradient with Variance Reduction in Multi-Agent Reinforcement Learning

Xiaoxiao Zhao , Jinlong Lei , Li Li

分类：机器学习

2021-11-25

本文研究了协同多智能体增强学习（MARL）的分布式政策梯度，在通信网络上的代理人旨在找到最佳政策，以最大限度地提高所有代理人的当地返回的平均值。由于政策梯度的非凹形性能函数，用于凸面问题的现有分布式随机优化方法不能直接用于Marl中的政策梯度。本文提出了一种具有方差减少和渐变跟踪的分布式策略梯度，以解决政策梯度的高差，并利用重要的重量来解决采样过程中的非静止问题。然后，我们在平均平均固定间隙上提供一个上限，这取决于迭代的数量，迷你批量大小，秒钟大小，问题参数和网络拓扑。我们进一步建立了样本和通信复杂性，以获得$ \ epsilon $-upprymate静止点。对MARL控制问题的数值实验进行了验证了所提出算法的有效性。

translated by 谷歌翻译

Decentralized Online Regularized Learning Over Random Time-Varying Graphs

Xiwei Zhang , Tao Li , Xiaozheng Fu

分类：机器学习 | (统计)机器学习

2022-06-07

我们研究了随机时间变化图的分散在线正规化线性回归算法。在每个时间步骤中，每个节点都运行一个在线估计算法，该算法由创新术语组成，该算法处理其自己的新测量，共识术语以其自身的估计和其邻居的加权量和具有添加性和乘法性噪声的加权总和，以防止正式化术语-配件。不需要回归矩阵和图形满足特殊的统计假设，例如相互独立性，时空独立性或平稳性。我们开发了估计误差的非负性超智能不平等，并证明所有节点的估计几乎可以肯定地收敛到未知的真实参数矢量，如果算法获得，图形和回归矩阵共同满足了样品路径路径时空时空的激发条件的持久性。特别是，如果图形均匀地有条件地共同连接并有条件平衡，并且所有节点的回归模型在有条件的时空上共同观察到，则该条件可以通过选择适当的算法增益来获得适当的算法增益，并且在均匀的算法中均匀地共同观察到，在均值中，算法在卑鄙的正方形中且几乎是在卑鄙的。此外，我们证明了遗憾的上限$ \ MATHCAL O（t^{1- \ tau} \ ln T）$，其中$ \ tau \ in（0.5,1）$是一个不变的，取决于算法的增长。

translated by 谷歌翻译

Distributed Bayesian Learning of Dynamic States

Mert Kayaalp , Virginia Bordignon , Stefan Vlaski , Vincenzo Matta , Ali H. Sayed

分类：机器学习

2022-12-05

This work studies networked agents cooperating to track a dynamical state of nature under partial information. The proposed algorithm is a distributed Bayesian filtering algorithm for finite-state hidden Markov models (HMMs). It can be used for sequential state estimation tasks, as well as for modeling opinion formation over social networks under dynamic environments. We show that the disagreement with the optimal centralized solution is asymptotically bounded for the class of geometrically ergodic state transition models, which includes rapidly changing models. We also derive recursions for calculating the probability of error and establish convergence under Gaussian observation models. Simulations are provided to illustrate the theory and to compare against alternative approaches.

translated by 谷歌翻译

Quantization enabled Privacy Protection in Decentralized Stochastic Optimization

Yongqiang Wang , Tamer Basar

分类：机器学习

2022-08-07

通过使多个代理在缺乏中央协调员的情况下合作解决全球优化问题，分散的随机优化在像机器学习，控制和传感器网络这样的多种多样的领域中，人们的注意力越来越多。由于相关数据通常包含敏感信息，例如用户位置和个人身份，因此在实施分散的随机优化时，隐私保护已成为至关重要的需求。在本文中，我们提出了一种分散的随机优化算法，即使在存在与量化幅度成正比的积极量化误差的情况下，该算法也能够保证可证明的收敛精度。该结果同时适用于凸面和非凸目标函数，使我们能够利用积极的量化方案来混淆共享信息，因此可以在不失去可证明的优化精度的情况下进行隐私保护。实际上，通过使用将任何值量化为三个数值级别的任何值的{随机}三元量化方案，我们在分散的随机优化中实现了基于量化的严格差异隐私，以前尚未报告。结合提出的量化方案，提出的算法首次确保了分散的随机优化中的严格差异隐私，而不会失去可证明的收敛精度。分布式估计问题以及基准计算机学习数据集上分散学习的数值实验的仿真结果证实了所提出方法的有效性。

translated by 谷歌翻译

Distributed Information-based Source Seeking

Tianpeng Zhang , Victor Qin , Yujie Tang , Na Li

分类：机器人

2022-09-20

在本文中，我们设计了一个基于信息的多机器人来源，以寻求算法，其中一组移动传感器仅使用基于局部范围的测量值就本地化并移动靠近单个源。在算法中，移动传感器执行源标识/本地化以估计源位置；同时，他们移至新位置，以最大程度地提高有关传感器测量中包含的源的Fisher信息。在这样做的过程中，它们改善了源位置估计，并更靠近源。与传统的攀登算法相比，我们的算法在收敛速度方面具有优越性，在测量模型和信息指标的选择中是灵活的，并且对测量模型误差非常强大。此外，我们提供了算法的完全分布式版本，每个传感器都决定自己的动作，并且仅通过稀疏的通信网络与邻居共享信息。我们进行密集的仿真实验，以测试带有光传感器的小型地面车辆上的大规模系统和物理实验的算法，这表明在寻求光源方面取得了成功。

translated by 谷歌翻译

Applications of Multi-Agent Reinforcement Learning in Future Internet: A Comprehensive Survey

Tianxu Li , Kun Zhu , Nguyen Cong Luong , Dusit Niyato , Qihui Wu , Yang Zhang , Bing Chen

分类：人工智能 | 机器学习

2021-10-26

未来的互联网涉及几种新兴技术，例如5G和5G网络，车辆网络，无人机（UAV）网络和物联网（IOT）。此外，未来的互联网变得异质并分散了许多相关网络实体。每个实体可能需要做出本地决定，以在动态和不确定的网络环境下改善网络性能。最近使用标准学习算法，例如单药强化学习（RL）或深入强化学习（DRL），以使每个网络实体作为代理人通过与未知环境进行互动来自适应地学习最佳决策策略。但是，这种算法未能对网络实体之间的合作或竞争进行建模，而只是将其他实体视为可能导致非平稳性问题的环境的一部分。多机构增强学习（MARL）允许每个网络实体不仅观察环境，还可以观察其他实体的政策来学习其最佳政策。结果，MAL可以显着提高网络实体的学习效率，并且最近已用于解决新兴网络中的各种问题。在本文中，我们因此回顾了MAL在新兴网络中的应用。特别是，我们提供了MARL的教程，以及对MARL在下一代互联网中的应用进行全面调查。特别是，我们首先介绍单代机Agent RL和MARL。然后，我们回顾了MAL在未来互联网中解决新兴问题的许多应用程序。这些问题包括网络访问，传输电源控制，计算卸载，内容缓存，数据包路由，无人机网络的轨迹设计以及网络安全问题。

translated by 谷歌翻译

Formation control with connectivity assurance for missile swarm: a natural co-evolutionary strategy approach

Junda Chen

分类：神经与进化计算

2022-08-24

形成控制问题是群体智能领域中最关心的主题之一，通常通过常规数学方法来解决。然而，在本文中，我们提出了一种元疗法方法，该方法利用了一种自然的共同进化策略来解决一群导弹的形成控制问题。导弹群是由具有异质参考目标的二阶系统建模的，并将指数误差函数作为目标函数，以使群体融合到满足某些形成要求的最佳平衡状态。为了关注本地最佳和不稳定进化的问题，我们纳入了一种新颖的基于模型的政策约束和人口适应策略，从而大大减轻了绩效退化。通过在网络通信领域中应用Molloy reed标准，我们开发了一种自适应拓扑方法，该方法可以通过理论和实验验证节点失败及其有效性下的连通性及其有效性。实验结果有助于提议的形成控制方法的有效性。更重要的是，我们表明将通用形成控制问题视为马尔可夫决策过程（MDP）并通过迭代学习解决它是可行的。

translated by 谷歌翻译

HTML版本

Multi-Stage Hybrid Federated Learning over Large-Scale D2D-Enabled Fog Networks

Seyyedali Hosseinalipour , Sheikh Shams Azam , Christopher G. Brinton , Nicolo Michelusi , Vaneet Aggarwal , David J. Love , Huaiyu Dai

分类：机器学习

2020-07-18

联合学习产生了重大兴趣，几乎所有作品都集中在一个“星形”拓扑上，其中节点/设备每个都连接到中央服务器。我们远离此架构，并将其通过网络维度扩展到最终设备和服务器之间存在多个节点的情况。具体而言，我们开发多级混合联合学习（MH-FL），是层内模型学习的混合，将网络视为基于多层群集的结构。 MH-FL认为集群中的节点中的拓扑结构，包括通过设备到设备（D2D）通信形成的本地网络，并假设用于联合学习的半分散式架构。它以协作/协作方式（即，使用D2D交互）在不同网络层处的设备进行编程，以在模型参数上形成本地共识，并将其与树形层次层的层之间的多级参数中继相结合。我们相对于网络拓扑（例如，光谱半径）和学习算法的参数来得出MH-F1的收敛的大界限（例如，不同簇中的D2D圆数的数量）。我们在不同的集群中获得了一系列D2D轮的政策，以保证有限的最佳差距或收敛到全局最佳。然后，我们开发一个分布式控制算法，用于MH-FL在每个集群中调整每个集群的D2D轮，以满足特定的收敛标准。我们在现实世界数据集上的实验验证了我们的分析结果，并展示了MH-FL在资源利用率指标方面的优势。

translated by 谷歌翻译