智能论文笔记

On the Probability of Necessity and Sufficiency of Explaining Graph Neural Networks: A Lower Bound Optimization Approach

Ruichu Cai , Yuxuan Zhu , Xuexin Chen , Yuan Fang , Min Wu , Jie Qiao , Zhifeng Hao

分类：机器学习

2022-12-14

Explainability of Graph Neural Networks (GNNs) is critical to various GNN applications but remains an open challenge. A convincing explanation should be both necessary and sufficient simultaneously. However, existing GNN explaining approaches focus on only one of the two aspects, necessity or sufficiency, or a trade-off between the two. To search for the most necessary and sufficient explanation, the Probability of Necessity and Sufficiency (PNS) can be applied since it can mathematically quantify the necessity and sufficiency of an explanation. Nevertheless, the difficulty of obtaining PNS due to non-monotonicity and the challenge of counterfactual estimation limits its wide use. To address the non-identifiability of PNS, we resort to a lower bound of PNS that can be optimized via counterfactual estimation, and propose Necessary and Sufficient Explanation for GNN (NSEG) via optimizing that lower bound. Specifically, we employ nearest neighbor matching to generate counterfactual samples for the features, which is different from the random perturbation. In particular, NSEG combines the edges and node features to generate an explanation, where the common edge explanation is a special case of the combined explanation. Empirical study shows that NSEG achieves excellent performance in generating the most necessary and sufficient explanations among a series of state-of-the-art methods.

translated by 谷歌翻译

Long-term Causal Effects Estimation via Latent Surrogates Representation Learning

Ruichu Cai , Weilin Chen , Zeqin Yang , Shu Wan , Chen Zheng , Xiaoqing Yang , Jiecheng Guo

分类：机器学习 | 人工智能

2022-08-09

在许多现实世界应用中，例如市场和医学，基于短期替代物的长期因果影响是一个重大但具有挑战性的问题。尽管在某些领域取得了成功，但大多数现有方法以理想主义和简单的方式估算了因果影响 - 忽略了短期结果之间的因果结构，而将所有这些因果关系视为代孕。但是，这种方法不能很好地应用于现实世界中，其中部分观察到的替代物与短期结局中的代理混合在一起。为此，我们开发了灵活的方法激光器，以估计在更现实的情况下观察或观察到代理的更现实的情况。（ivae）在所有候选者上恢复所有有效的替代物，而无需区分观察到的替代物或潜在代理人的代理。在回收的替代物的帮助下，我们进一步设计了对长期因果影响的公正估计。关于现实世界和半合成数据集的广泛实验结果证明了我们提出的方法的有效性。

translated by 谷歌翻译

REST: Debiased Social Recommendation via Reconstructing Exposure Strategies

Ruichu Cai , Fengzhu Wu , Zijian Li , Jie Qiao , Wei Chen , Yuexing Hao , Hao Gu

分类：机器学习

2022-01-13

建议制度，依靠历史观察数据来模仿用户和物品之间的复杂关系，取得了巨大的成功，在现实世界中取得了巨大的成功。选择偏见是现有的现有观测数据基于方法的最重要问题之一，其实际上是由多种类型的不观察室的暴露策略引起的（例如促销和假期效应）。虽然已经提出了各种方法来解决这个问题，但它们主要依赖于隐含的脱叠技术，但没有明确建立未观察的曝光策略。通过明确重建曝光策略（简称休息），我们将推荐问题正式化为反事实推理，并提出了脱叠的社会推荐方法。在休息时，我们假设项目的曝光由潜在曝光策略，用户和项目控制。基于上述生成过程，首先通过识别分析提供我们方法的理论保证。其次，在社交网络和项目的帮助下，我们采用了变分自动编码器来重建潜在的曝光策略。第三，我们通过利用回收的曝光策略制定基于反事实推理的建议算法。四个现实世界数据集的实验，包括三个已发布的数据集和一个私人微信官方帐户数据集，展示了几种最先进的方法的显着改进。

translated by 谷歌翻译

Motif Graph Neural Network

Xuexin Chen , Ruichu Cai , Yuan Fang , Min Wu , Zijian Li , Zhifeng Hao

分类：机器学习

2021-12-30

图表可以模拟实体之间的复杂交互，它在许多重要的应用程序中自然出现。这些应用程序通常可以投入到标准图形学习任务中，其中关键步骤是学习低维图表示。图形神经网络（GNN）目前是嵌入方法中最受欢迎的模型。然而，邻域聚合范例中的标准GNN患有区分\ EMPH {高阶}图形结构的有限辨别力，而不是\ EMPH {低位}结构。为了捕获高阶结构，研究人员求助于主题和开发的基于主题的GNN。然而，现有的基于主基的GNN仍然仍然遭受较少的辨别力的高阶结构。为了克服上述局限性，我们提出了一个新颖的框架，以更好地捕获高阶结构的新框架，铰接于我们所提出的主题冗余最小化操作员和注射主题组合的新颖框架。首先，MGNN生成一组节点表示W.R.T.每个主题。下一阶段是我们在图案中提出的冗余最小化，该主题在彼此相互比较并蒸馏出每个主题的特征。最后，MGNN通过组合来自不同图案的多个表示来执行节点表示的更新。特别地，为了增强鉴别的功率，MGNN利用重新注射功能来组合表示的函数w.r.t.不同的主题。我们进一步表明，我们的拟议体系结构增加了GNN的表现力，具有理论分析。我们展示了MGNN在节点分类和图形分类任务上的七个公共基准上表现出最先进的方法。

translated by 谷歌翻译

CCSL: A Causal Structure Learning Method from Multiple Unknown Environments

Wei Chen , Yunjin Wu , Ruichu Cai , Yueguo Chen , Zhifeng Hao

分类：机器学习

2021-11-18

大多数现有的因果结构学习方法需要数据以独立且相同分布（i.i.d.），当数据来自不同环境时，通常无法保证。以前的一些努力在两个独立的阶段中尝试解决这个问题，即首次发现i.i.d.非i.i.d的集群。样品，然后学习来自不同组的因果结构。这种直接的解决方案忽略了两个阶段之间的内在连接，即聚类阶段，学习阶段应该被相同的因果机制引导。为此，我们提出了一个统一的因果关系结构学习（命名为CCSL）方法，用于来自非I.I.D的因果区。数据。该方法同时集成了以下两个任务：1）聚类对象具有相同的因果机制; 2）学习受试者样本的因果关系。具体而言，对于前者来说，我们基于因果结构的相似性为集群样本提供了与因果关系相关的中餐馆流程;对于后者，我们介绍了一种基于改性的基于改进的方法来学习因果结构。理论结果提供了线性非高斯假设下因果模型和聚类模型的识别。模拟和现实世界数据的实验结果进一步验证了所提出的方法的正确性和有效性。

translated by 谷歌翻译

TEA: A Sequential Recommendation Framework via Temporally Evolving Aggregations

Zijian Li , Ruichu Cai , Fengzhu Wu , Sili Zhang , Hao Gu , Yuexing Hao , Yuguang

分类：机器学习

2021-11-14

顺序推荐旨在为特定时间戳在特定时间戳提供历史行为中为用户选择最合适的项目。现有方法通常根据像马尔可夫链等转换的方法模拟用户行为序列。然而，这些方法也隐含地假设用户在不考虑用户之间的影响而彼此独立。实际上，这种影响在序列推荐中发挥着重要作用，因为用户的行为容易受其他人的影响。因此，期望聚合用户行为和用户之间的影响，这些用户在时间上演化并涉及用户和项目的异构图。在本文中，我们纳入了动态用户项异构图，提出了一种新的顺序推荐框架。结果，可以考虑历史行为以及用户之间的影响。为此，我们首先将顺序建议形式正式确定估计时间动态异构图和用户行为序列的条件概率的问题。之后，我们利用条件随机字段来聚合异构图形和用户行为以进行概率估计，并采用伪似然方法来得出易行目标函数。最后，我们提供所提出的框架的可扩展和灵活的实现。三个现实世界数据集的实验结果不仅展示了我们所提出的方法的有效性，而且还提供了一些关于顺序推荐的有洞察力的发现。

translated by 谷歌翻译

Transferable Time-Series Forecasting under Causal Conditional Shift

Zijian Li , Ruichu Cai , Tom Z. J Fu , Kun Zhang

分类：机器学习

2021-11-05

本文重点研究\文本颜色的问题{黑} {半监督}域适配用于时间序列预测，这是一个很容易被忽视的，但具有挑战性的问题是由于可变的和复杂的条件的依赖关系。事实上，这些特定领域的条件依赖主要领导的数据偏移量，时间滞后，并且变体数据的分布。为了解决这个问题，我们分析了变条件依赖于时间序列数据，并认为因果结构是不同的域之间的稳定，并进一步提高了因果条件转变的假设。通过这一假设的启发，我们考虑的时间序列数据的因果生成过程，并制定一个终端到终端的型号为转移的时间序列预测。该方法不仅可以发现跨域\ textit {Granger因果}也解决了跨域的时间序列预测问题。它甚至可以提供预测结果在一定程度上的解释性。我们进一步分析理论所提出的方法，其中在目标域泛化的错误不仅通过在源和目标域，但也受到来自不同域的因果结构之间的相似经验的风险有界的优越性。在合成的和真实数据实验结果表明，用于转让的时间序列预测了该方法的有效性。

translated by 谷歌翻译

SADGA: Structure-Aware Dual Graph Aggregation Network for Text-to-SQL

Ruichu Cai , Jinjie Yuan , Boyan Xu , Zhifeng Hao

分类：自然语言处理

2021-11-01

Text-to-sql任务，旨在将问题的自然语言转化为SQL查询，最近引起了很多关注。 Text-to-SQL最具挑战性的问题之一是如何将培训的模型概括为未遵守的数据库模式，也称为跨域文本到SQL任务。关键在于（i）编码方法的概括性，以模拟问题和数据库模式和（ii）问题模式链接方法，以了解数据库模式中问题和表/列之间的单词之间的映射。专注于上述两个关键问题，我们提出了一个用于跨域文本到SQL的结构感知双图形聚合网络（Sadga）。在Sadga中，我们采用图形结构为自然语言问题和数据库模式提供统一的编码模型。基于所提出的统一建模，我们进一步设计了一个结构感知聚合方法，以了解问题图和架构图之间的映射。结构感知聚合方法具有全局图链接，本地图链接和双图聚合机制。我们不仅研究了我们的提案的表现，而且还在撰写本文时挑战挑战文本到SQL基准蜘蛛的第3位。

translated by 谷歌翻译

On the Role of Entropy-based Loss for Learning Causal Structures with Continuous Optimization

Weilin Chen , Jie Qiao , Ruichu Cai , Zhifeng Hao

分类：机器学习 | 人工智能

2021-06-05

在许多科学领域，观察数据中的因果发现是一项重要但具有挑战性的任务。最近，一种称为宣传的非组合定向无环约束的方法将因果结构学习问题作为使用最小二乘损失的连续优化问题。尽管在标准高斯噪声假设下，最小二乘损耗函数是合理的，但如果假设不存在，则受到限制。在这项工作中，我们从理论上表明，违反高斯噪声假设将阻碍因果方向的识别，从而使因果强度以及线性案例中的噪声和噪声方差完全确定。在非线性情况下的噪音。因此，我们提出了一个更一般的基于熵的损失，理论上与任何噪声分布下的可能性得分一致。我们对合成数据和现实世界数据进行了广泛的经验评估，以验证所提出的方法的有效性，并表明我们的方法在结构锤距离，错误发现率和真实的正速率矩阵方面达到了最佳状态。

translated by 谷歌翻译

Rethinking Rotation Invariance with Point Cloud Registration

Jianhui Yu , Chaoyi Zhang , Weidong Cai

分类：计算机视觉

2022-12-31

Recent investigations on rotation invariance for 3D point clouds have been devoted to devising rotation-invariant feature descriptors or learning canonical spaces where objects are semantically aligned. Examinations of learning frameworks for invariance have seldom been looked into. In this work, we review rotation invariance in terms of point cloud registration and propose an effective framework for rotation invariance learning via three sequential stages, namely rotation-invariant shape encoding, aligned feature integration, and deep feature registration. We first encode shape descriptors constructed with respect to reference frames defined over different scales, e.g., local patches and global topology, to generate rotation-invariant latent shape codes. Within the integration stage, we propose Aligned Integration Transformer to produce a discriminative feature representation by integrating point-wise self- and cross-relations established within the shape codes. Meanwhile, we adopt rigid transformations between reference frames to align the shape codes for feature consistency across different scales. Finally, the deep integrated feature is registered to both rotation-invariant shape codes to maximize feature similarities, such that rotation invariance of the integrated feature is preserved and shared semantic information is implicitly extracted from shape codes. Experimental results on 3D shape classification, part segmentation, and retrieval tasks prove the feasibility of our work. Our project page is released at: https://rotation3d.github.io/.

translated by 谷歌翻译