智能论文笔记

Learning Linear Non-Gaussian Polytree Models

Daniele Tramontano , Anthea Monod , Mathias Drton

分类： (统计)机器学习 | 机器学习

2022-08-13

在图形因果发现的背景下，我们适应了线性非高斯无环模型（Lingams）的多功能框架，以提出新算法以有效地学习polytrees的图形。我们的方法结合了Chow- Liu算法，该算法首先学习了无向树结构，并与新的方案定向边缘。方向方案评估数据生成分布的矩之间的代数关系，并且计算便宜。我们为我们的方法建立了高维的一致性结果，并比较了数值实验中的不同算法版本。

translated by 谷歌翻译

On the Representation of Causal Background Knowledge and its Applications in Causal Inference

Zhuangyan Fang , Ruiqi Zhao , Yue Liu , Yangbo He

分类：人工智能 | 机器学习 | (统计)机器学习

2022-07-10

在观察性研究中，经常遇到有关存在或缺乏因果边缘和路径的因果背景知识。由于背景知识而导致的马尔可夫等效dag的子类共享的指向边缘和链接可以由因果关系最大部分定向的无循环图（MPDAG）表示。在本文中，我们首先提供了因果MPDAG的声音和完整的图形表征，并提供了因果MPDAG的最小表示。然后，我们介绍了一种名为Direct Causal子句（DCC）的新颖表示，以统一形式表示所有类型的因果背景知识。使用DCC，我们研究因果背景知识的一致性和等效性，并表明任何因果背景知识集都可以等效地分解为因果MPDAG，以及最小的残留DCC。还提供了多项式时间算法，以检查一致性，等效性并找到分解的MPDAG和残留DCC。最后，有了因果背景知识，我们证明了一个足够且必要的条件来识别因果关系，并且出人意料地发现因果效应的可识别性仅取决于分解的MPDAG。我们还开发了局部IDA型算法，以估计无法识别效应的可能值。模拟表明因果背景知识可以显着提高因果影响的识别性。

translated by 谷歌翻译

A Fast Non-parametric Approach for Causal Structure Learning in Polytrees

Mona Azadkia , Armeen Taeb , Peter Bühlmann

分类： (统计)机器学习

2021-11-29

我们研究了因果结构学习的问题，没有关于功能关系和噪声的假设。我们开发DAG-Foci，这是一种基于\ Cite {Azadkia2019Simple}的焦点变量选择算法的计算快速算法。DAG-Foci不需要调整参数并输出父母和Markov边界的响应变量的响应变量。当底层图形是多料时，我们提供了我们程序的高维保证。此外，我们展示了DAG-Foci在计算生物学\ Cite {Sachs2005Causal}的真实数据上的适用性，并说明了我们对侵犯假设的方法的稳健性。

translated by 谷歌翻译

Estimating large causal polytree skeletons from small samples

Sourav Chatterjee , Mathukumalli Vidyasagar

分类：机器学习 | (统计)机器学习

2022-09-15

我们考虑了从相对较小的I.I.D.估算大因果多树的骨骼的问题。样本。这是由于确定因果结构的问题，当变量数量与样本量非常大，例如基因调节网络中的问题。我们给出了一种算法，该算法在此类设置中以高精度恢复了树。该算法在基本上没有分布或建模假设下起作用，而不是一些轻度的非分类条件。

translated by 谷歌翻译

Representation of Context-Specific Causal Models with Observational and Interventional Data

Eliana Duarte , Liam Solus

分类： (统计)机器学习

2021-01-22

我们考虑代表代理模型的问题，该模型使用我们称之为CSTREES的阶段树模型的适当子类对离散数据编码离散数据的原因模型。我们表明，可以通过集合表达CSTREE编码的上下文专用信息。由于并非所有阶段树模型都承认此属性，CSTREES是一个子类，可提供特定于上下文的因果信息的透明，直观和紧凑的表示。我们证明了CSTREEES承认全球性马尔可夫属性，它产生了模型等价的图形标准，概括了Verma和珍珠的DAG模型。这些结果延伸到一般介入模型设置，使CSTREES第一族的上下文专用模型允许介入模型等价的特征。我们还为CSTREE的最大似然估计器提供了一种封闭式公式，并使用它来表示贝叶斯信息标准是该模型类的本地一致的分数函数。在模拟和实际数据上分析了CSTHEELE的性能，在那里我们看到与CSTREELE而不是一般上演树的建模不会导致预测精度的显着损失，同时提供了特定于上下文的因果信息的DAG表示。

translated by 谷歌翻译

Robust Model Selection of Non Tree-Structured Gaussian Graphical Models

Abrar Zahin , Rajasekhar Anguluri , Oliver Kosut , Lalitha Sankar , Gautam Dasarathy

分类： (统计)机器学习 | 机器学习

2022-11-10

We consider the problem of learning the structure underlying a Gaussian graphical model when the variables (or subsets thereof) are corrupted by independent noise. A recent line of work establishes that even for tree-structured graphical models, only partial structure recovery is possible and goes on to devise algorithms to identify the structure up to an (unavoidable) equivalence class of trees. We extend these results beyond trees and consider the model selection problem under noise for non tree-structured graphs, as tree graphs cannot model several real-world scenarios. Although unidentifiable, we show that, like the tree-structured graphs, the ambiguity is limited to an equivalence class. This limited ambiguity can help provide meaningful clustering information (even with noise), which is helpful in computer and social networks, protein-protein interaction networks, and power networks. Furthermore, we devise an algorithm based on a novel ancestral testing method for recovering the equivalence class. We complement these results with finite sample guarantees for the algorithm in the high-dimensional regime.

translated by 谷歌翻译

Learning Bayesian Networks in the Presence of Structural Side Information

Ehsan Mokhtarian , Sina Akbari , Fateme Jamshidi , Jalal Etesami , Negar Kiyavash

分类：机器学习

2021-12-20

我们研究在有关系统的结构侧信息时学习一组变量的贝叶斯网络（BN）的问题。众所周知，学习一般BN的结构在计算上和统计上具有挑战性。然而，通常在许多应用中，关于底层结构的侧面信息可能会降低学习复杂性。在本文中，我们开发了一种基于递归约束的算法，其有效地将这些知识（即侧信息）纳入学习过程。特别地，我们研究了关于底层BN的两种类型的结构侧信息：（i）其集团数的上限是已知的，或者（ii）它是无菱形的。我们为学习算法提供理论保证，包括每个场景所需的最坏情况的测试数量。由于我们的工作，我们表明可以通过多项式复杂性学习有界树木宽度BNS。此外，我们评估了综合性和现实世界结构的算法的性能和可扩展性，并表明它们优于最先进的结构学习算法。

translated by 谷歌翻译

Efficient Bayesian network structure learning via local Markov boundary search

Ming Gao , Bryon Aragam

分类：人工智能 | 机器学习 | (统计)机器学习

2021-10-12

我们分析了在没有特定分布假设的常规设置中从观察数据的学习中学循环图形模型的复杂性。我们的方法是信息定理，并使用本地马尔可夫边界搜索程序，以便在基础图形模型中递归地构建祖先集。也许令人惊讶的是，我们表明，对于某些图形集合，一个简单的前向贪婪搜索算法（即没有向后修剪阶段）足以学习每个节点的马尔可夫边界。这显着提高了我们在节点的数量中显示的样本复杂性。然后应用这一点以在从文献中概括存在现有条件的新型标识性条件下学习整个图。作为独立利益的问题，我们建立了有限样本的保障，以解决从数据中恢复马尔可夫边界的问题。此外，我们将我们的结果应用于特殊情况的Polytrees，其中假设简化，并提供了多项识别的明确条件，并且在多项式时间中可以识别和可知。我们进一步说明了算法在仿真研究中易于实现的算法的性能。我们的方法是普遍的，用于无需分布假设的离散或连续分布，并且由于这种棚灯对有效地学习来自数据的定向图形模型结构所需的最小假设。

translated by 谷歌翻译

Characterization and Greedy Learning of Gaussian Structural Causal Models under Unknown Interventions

Juan L. Gamella , Armeen Taeb , Christina Heinze-Deml , Peter Bühlmann

分类： (统计)机器学习

2022-11-27

We consider the problem of recovering the causal structure underlying observations from different experimental conditions when the targets of the interventions in each experiment are unknown. We assume a linear structural causal model with additive Gaussian noise and consider interventions that perturb their targets while maintaining the causal relationships in the system. Different models may entail the same distributions, offering competing causal explanations for the given observations. We fully characterize this equivalence class and offer identifiability results, which we use to derive a greedy algorithm called GnIES to recover the equivalence class of the data-generating model without knowledge of the intervention targets. In addition, we develop a novel procedure to generate semi-synthetic data sets with known causal ground truth but distributions closely resembling those of a real data set of choice. We leverage this procedure and evaluate the performance of GnIES on synthetic, real, and semi-synthetic data sets. Despite the strong Gaussian distributional assumption, GnIES is robust to an array of model violations and competitive in recovering the causal structure in small- to large-sample settings. We provide, in the Python packages "gnies" and "sempler", implementations of GnIES and our semi-synthetic data generation procedure.

translated by 谷歌翻译

Counting Markov Equivalent Directed Acyclic Graphs Consistent with Background Knowledge

Vidya Sagar Sharma

分类：人工智能 | 机器学习

2022-06-14

Wien \ \'inst，Bannach和li \'Skiewicz（AAAI 2021）最近给出了一种用于计算马尔可夫等效类中定向无环形数量数量的多项式精确算法。在本文中，我们考虑了更一般的问题当某些边缘的方向也固定时，计算马尔可夫等效类中有向无环的数量的数量（例如，在部分可用的介入数据时会出现此设置）。从理论上讲，复杂性。相比之下，我们证明了问题在有趣的一类实例中仍然可以解决，它是通过确定``固定参数tractable''。特别是，我们的计数算法在时间范围内运行。多项式在图的大小中，其中多项式的程度\ emph {not}取决于提供的附加边数作为输入的数量。

translated by 谷歌翻译

Chow-Liu++: Optimal Prediction-Centric Learning of Tree Ising Models

Enric Boix-Adsera , Guy Bresler , Frederic Koehler

分类：机器学习

2021-06-07

我们考虑从数据学习树结构ising模型的问题，使得使用模型计算的后续预测是准确的。具体而言，我们的目标是学习一个模型，使得小组变量$ S $的后海报$ p（x_i | x_s）$。自推出超过50年以来，有效计算最大似然树的Chow-Liu算法一直是学习树结构图形模型的基准算法。 [BK19]示出了关于以预测的局部总变化损耗的CHOW-LIU算法的样本复杂性的界限。虽然这些结果表明，即使在恢复真正的基础图中也可以学习有用的模型是不可能的，它们的绑定取决于相互作用的最大强度，因此不会达到信息理论的最佳选择。在本文中，我们介绍了一种新的算法，仔细结合了Chow-Liu算法的元素，以便在预测的损失下有效地和最佳地学习树ising模型。我们的算法对模型拼写和对抗损坏具有鲁棒性。相比之下，我们表明庆祝的Chow-Liu算法可以任意次优。

translated by 谷歌翻译

Learning Sparse Fixed-Structure Gaussian Bayesian Networks

Arnab Bhattacharyya , Davin Choo , Rishikesh Gajjala , Sutanu Gayen , Yuhao Wang

分类：机器学习 | (统计)机器学习

2021-07-22

高斯贝叶斯网络（又称线性高斯结构方程模型）广泛用于建模连续变量之间的因果相互作用。在这项工作中，我们研究了学习固定结构高斯贝叶斯网络的问题，直到总变化距离有界误差。我们分析了常用的节点最小二乘回归（最小值），并证明其具有近乎最佳的样品复杂性。我们还研究了一些问题的新算法： - batchavgleastsquares平均在每个节点处采用最小二乘解决方案的几批批次，因此可以在批次大小和批次数量之间插入。我们表明，batchavgleastsquares也具有接近最佳的样品复杂性。 -Cauchyest将解决方案的中位数带到每个节点处的几批线性系统。我们表明，专门针对Polytrees的算法Cauchyesttree具有接近最佳的样品复杂性。在实验上，我们表明，对于未经污染的，可实现的数据，最小值的算法表现最好，但是在存在污染或dag sillsperification的情况下，cauchyest/cauchyesttree和batchavgleastsquares的性能更好。

translated by 谷歌翻译

A Unified Experiment Design Approach for Cyclic and Acyclic Causal Models

Ehsan Mokhtarian , Saber Salehkaleybar , AmirEmad Ghassami , Negar Kiyavash

分类：机器学习 | 人工智能

2022-05-20

We study experiment design for unique identification of the causal graph of a system where the graph may contain cycles. The presence of cycles in the structure introduces major challenges for experiment design as, unlike acyclic graphs, learning the skeleton of causal graphs with cycles may not be possible from merely the observational distribution. Furthermore, intervening on a variable in such graphs does not necessarily lead to orienting all the edges incident to it. In this paper, we propose an experiment design approach that can learn both cyclic and acyclic graphs and hence, unifies the task of experiment design for both types of graphs. We provide a lower bound on the number of experiments required to guarantee the unique identification of the causal graph in the worst case, showing that the proposed approach is order-optimal in terms of the number of experiments up to an additive logarithmic term. Moreover, we extend our result to the setting where the size of each experiment is bounded by a constant. For this case, we show that our approach is optimal in terms of the size of the largest experiment required for uniquely identifying the causal graph in the worst case.

translated by 谷歌翻译

Large-Scale Differentiable Causal Discovery of Factor Graphs

Romain Lopez , Jan-Christian Hütter , Jonathan K. Pritchard , Aviv Regev

分类： (统计)机器学习 | 机器学习

2022-06-15

因果推断的一个共同主题是学习观察到的变量（也称为因果发现）之间的因果关系。考虑到大量候选因果图和搜索空间的组合性质，这通常是一项艰巨的任务。也许出于这个原因，到目前为止，大多数研究都集中在相对较小的因果图上，并具有多达数百个节点。但是，诸如生物学之类的领域的最新进展使生成实验数据集，并进行了数千种干预措施，然后进行了数千个变量的丰富分析，从而增加了机会和迫切需要大量因果图模型。在这里，我们介绍了因子定向无环图（F-DAG）的概念，是将搜索空间限制为非线性低级别因果相互作用模型的一种方法。将这种新颖的结构假设与最近的进步相结合，弥合因果发现与连续优化之间的差距，我们在数千个变量上实现了因果发现。此外，作为统计噪声对此估计程序的影响的模型，我们根据随机图研究了F-DAG骨架的边缘扰动模型，并量化了此类扰动对F-DAG等级的影响。该理论分析表明，一组候选F-DAG比整个DAG空间小得多，因此在很难评估基础骨架的高维度中更统计学上的稳定性。我们提出了因子图（DCD-FG）的可区分因果发现，这是对高维介入数据的F-DAG约束因果发现的可扩展实现。 DCD-FG使用高斯非线性低级结构方程模型，并且在模拟中的最新方法以及最新的大型单细胞RNA测序数据集中，与最新方法相比显示出显着改善遗传干预措施。

translated by 谷歌翻译

Identifying Mixtures of Bayesian Network Distributions

Spencer L. Gordon , Bijan Mazaheri , Yuval Rabani , Leonard J. Schulman

分类：机器学习 | (统计)机器学习

2021-12-22

贝叶斯网络是一组$ N $随机变量的定向非循环图（DAG）（用顶点标识）;贝叶斯网络分布（BND）是RV的概率分布，即在图中是马尔可夫的。这种模型的有限混合物是在较大的图表上对这些变量的投影，其具有额外的“隐藏”（或“隐藏”（或“潜伏”）随机变量$ U $，范围在$ \ {1，\ ldots，k \ $，以及从$ U $到其他每个其他顶点的指示边。这种类型的模型是对因因果推理的基础，其中$ U $模型是一种混杂效果。一个非常特殊的案例一直是在理论文学中的长期兴趣：空图。这种分布只是$ k $产品分布的混合。考虑到k $产品分布的混合物的联合分布，以识别产物分布及其混合重量，这一直是长期的问题。我们的结果是：（1）我们改善了从$ \ exp（o（k ^ 2））$到$ \ exp（o（k \ log k）的$ k $产品分布的混合物的示例复杂性（和运行时））$。鉴于已知的$ \ exp（\ omega（k））$下限，这几乎可以最好。（2）我们为非空图表提供了第一算法。最大程度为$ \ delta $的图表的复杂性为$ \ exp（o（k（\ delta ^ 2 + \ log k）））$。（上述复杂性是近似和抑制辅助参数的依赖性。）

translated by 谷歌翻译

Learning latent causal graphs via mixture oracles

Bohdan Kivva , Goutham Rajendran , Pradeep Ravikumar , Bryon Aragam

分类：机器学习 | 人工智能 | (统计)机器学习

2021-06-29

我们研究了在存在潜在变量存在下从数据重建因果图形模型的问题。感兴趣的主要问题是在潜在变量上恢复因果结构，同时允许一般，可能在变量之间的非线性依赖性。在许多实际问题中，原始观测之间的依赖性（例如，图像中的像素）的依赖性比某些高级潜在特征（例如概念或对象）之间的依赖性要小得多，这是感兴趣的设置。我们提供潜在表示和潜在潜在因果模型的条件可通过减少到混合甲骨文来识别。这些结果突出了学习混合模型的顺序的良好研究问题与观察到和解开的基础结构的问题之间的富裕问题之间的有趣连接。证明是建设性的，并导致几种算法用于明确重建全图形模型。我们讨论高效算法并提供说明实践中算法的实验。

translated by 谷歌翻译

Counterfactual Fairness with Partially Known Causal Graph

Aoqi Zuo , Susan Wei , Tongliang Liu , Bo Han , Kun Zhang , Mingming Gong

分类：机器学习

2022-05-27

公平的机器学习旨在避免基于\ textit {敏感属性}（例如性别和种族）对个人或子人群的治疗。公平机器学习中的那些方法是基于因果推理确定的歧视和偏见的。尽管基于因果关系的公平学习吸引了越来越多的关注，但当前的方法假设真正的因果图是完全已知的。本文提出了一种一般方法，以实现反事实公平的概念时，当真实的因果图未知。为了能够选择导致反事实公平性的功能，我们得出了条件和算法，以识别\ textit上变量之间的祖先关系{部分定向的无循环图（pdag）}，具体来说，可以从一类可学到的dag中学到。观察数据与域知识相结合。有趣的是，我们发现可以实现反事实公平，就好像真正的因果图是完全知道的一样，当提供了特定的背景知识时：敏感属性在因果图中没有祖先。模拟和实际数据集的结果证明了我们方法的有效性。

translated by 谷歌翻译

Optimal structure identification with greedy search

分类：

In this paper we prove the so-called "Meek Conjecture". In particular, we show that if a DAG H is an independence map of another DAG G, then there exists a finite sequence of edge additions and covered edge reversals in G such that (1) after each edge modification H remains an independence map of G and ( 2) after all modifications G = H. As shown by Meek (1997), this result has an important consequence for Bayesian approaches to learning Bayesian networks from data: in the limit of large sample size, there exists a twophase greedy search algorithm that-when applied to a particular sparsely-connected search space-provably identifies a perfect map of the generative distribution if that perfect map is a DAG. We provide a new implementation of the search space, using equivalence classes as states, for which all operators used in the greedy search can be scored efficiently using local functions of the nodes in the domain. Finally, using both synthetic and real-world datasets, we demonstrate that the two-phase greedy approach leads to good solutions when learning with finite sample sizes.

translated by 谷歌翻译

A non-graphical representation of conditional independence via the neighbourhood lattice

Arash A. Amini , Bryon Aragam , Qing Zhou

分类： (统计)机器学习

2022-06-12

我们介绍并研究了分布的邻居晶格分解，这是有条件独立性的紧凑，非图形表示，在没有忠实的图形表示的情况下是有效的。这个想法是将变量的一组社区视为子集晶格，并将此晶格分配到凸sublattices中，每个晶格都直接编码有条件的独立关系集合。我们表明，这种分解存在于任何组成型绘画中，并且可以在高维度中有效且一致地计算出来。 {特别是，这给了一种方法来编码满足组合公理的分布所隐含的所有独立关系，该分布严格比图形方法通常假定的忠实假设弱弱。}我们还讨论了各种特殊案例，例如图形模型和投影晶格，每个晶格都有直观的解释。一路上，我们看到了这个问题与邻域回归密切相关的，该回归已在图形模型和结构方程式的背景下进行了广泛的研究。

translated by 谷歌翻译

Scalable Intervention Target Estimation in Linear Models

Burak Varici , Karthikeyan Shanmugam , Prasanna Sattigeri , Ali Tajer

分类：机器学习 | (统计)机器学习

2021-11-15

本文考虑了从观察和介入数据估算因果导向的非循环图中未知干预目标的问题。重点是线性结构方程模型（SEM）中的软干预。目前对因果结构的方法学习使用已知的干预目标或使用假设测试来发现即使是线性SEM也可以发现未知的干预目标。这严重限制了它们的可扩展性和样本复杂性。本文提出了一种可扩展和高效的算法，始终识别所有干预目标。关键思想是从与观察和介入数据集相关联的精度矩阵之间的差异来估计干预站点。它涉及反复估计不同亚空间子集中的这些站点。该算法的算法还可用于将给定的观察马尔可夫等效类更新为介入马尔可夫等价类。在分析地建立一致性，马尔可夫等效和采样复杂性。最后，实际和合成数据的仿真结果展示了所提出的可扩展因果结构恢复方法的增益。算法的实现和重现仿真结果的代码可用于\ url {https://github.com/bvarici/intervention- istimation}。

translated by 谷歌翻译