智能论文笔记

ISA-Net: Improved spatial attention network for PET-CT tumor segmentation

Zhengyong Huang , Sijuan Zou , Guoshuai Wang , Zixiang Chen , Hao Shen , Haiyan Wang , Na Zhang , Lu Zhang , Fan Yang , Haining Wangg

分类：计算机视觉

2022-11-04

Achieving accurate and automated tumor segmentation plays an important role in both clinical practice and radiomics research. Segmentation in medicine is now often performed manually by experts, which is a laborious, expensive and error-prone task. Manual annotation relies heavily on the experience and knowledge of these experts. In addition, there is much intra- and interobserver variation. Therefore, it is of great significance to develop a method that can automatically segment tumor target regions. In this paper, we propose a deep learning segmentation method based on multimodal positron emission tomography-computed tomography (PET-CT), which combines the high sensitivity of PET and the precise anatomical information of CT. We design an improved spatial attention network(ISA-Net) to increase the accuracy of PET or CT in detecting tumors, which uses multi-scale convolution operation to extract feature information and can highlight the tumor region location information and suppress the non-tumor region location information. In addition, our network uses dual-channel inputs in the coding stage and fuses them in the decoding stage, which can take advantage of the differences and complementarities between PET and CT. We validated the proposed ISA-Net method on two clinical datasets, a soft tissue sarcoma(STS) and a head and neck tumor(HECKTOR) dataset, and compared with other attention methods for tumor segmentation. The DSC score of 0.8378 on STS dataset and 0.8076 on HECKTOR dataset show that ISA-Net method achieves better segmentation performance and has better generalization. Conclusions: The method proposed in this paper is based on multi-modal medical image tumor segmentation, which can effectively utilize the difference and complementarity of different modes. The method can also be applied to other multi-modal data or single-modal data by proper adjustment.

translated by 谷歌翻译

Global Consistent Point Cloud Registration Based on Lie-algebraic Cohomology

Yuxue Ren , Baowei Jiang , Wei Chen , Na Lei , Xianfeng David Gu

分类：计算机视觉

2022-08-15

我们提出了一种新颖的有效方法，用于通过几何拓扑来解决全球点云注册问题。基于许多点云成对注册方法（例如ICP），我们关注沿任何循环的转换组成的累积误差问题。本文的主要技术贡献是仅使用泊松方程式消除错误的线性方法。我们从Hodge-Helmhotz分解定理和在现实世界场景的多个RGBD数据集中进行了实验，证明了我们方法的一致性。实验结果还表明，我们的全球注册方法运行迅速并提供准确的重建。

translated by 谷歌翻译

Interaction Pattern Disentangling for Multi-Agent Reinforcement Learning

Shunyu Liu , Jie Song , Yihe Zhou , Na Yu , Kaixuan Chen , Zunlei Feng , Mingli Song

分类：机器学习 | 人工智能

2022-07-08

深层合作的多方强化学习已经证明了其在各种复杂的控制任务上取得了巨大的成功。但是，多学院学习的最新进展主要集中在价值分解上，而使实体交互仍然交织在一起，这很容易导致对实体之间的嘈杂相互作用过度拟合。在这项工作中，我们引入了一种新型的交互模式分离（OPT）方法，以将关节值函数不仅置于分散执行的代理值函数中，还将实体交互作用到交互原型中，每种都代表了潜在的交互作用模式在实体的子组中。 OPT促进了无关实体之间的嘈杂相互作用，从而显着提高了普遍性和可解释性。具体而言，OPT引入了稀疏分歧机制，以鼓励发现的相互作用原型之间的稀疏性和多样性。然后，该模型通过具有可学习权重的聚合器选择将这些原型重组为紧凑的交互模式。为了减轻部分可观察性引起的训练不稳定性问题，我们建议最大程度地提高聚合权重与每个代理的历史行为之间的相互信息。单任务和多任务基准的实验表明，所提出的方法得出的结果优于最先进的对应。我们的代码将公开可用。

translated by 谷歌翻译

Ask-AC: An Initiative Advisor-in-the-Loop Actor-Critic Framework

Shunyu Liu , Xinchao Wang , Na Yu , Jie Song , Kaixuan Chen , Zunlei Feng , Mingli Song

分类：机器学习 | 人工智能

2022-07-05

尽管取得了令人鼓舞的结果，但最先进的交互式强化学习方案依赖于以连续监控或预定义的规则的形式从顾问专家那里获得监督信号，这不可避免地导致了繁琐而昂贵的学习过程。在本文中，我们介绍了一项新型的倡议顾问，在循环演员批判框架中被称为Ask-AC，该框架用双向学习者的实用主义者代替了单方面的顾问指导机制，从而实现了自定义的和有效的范围学习者和顾问之间的消息交换。 Ask-AC的核心是两个互补的组件，即动作请求者和自适应状态选择器，可以很容易地将其纳入各种离散的参与者 - 批判性架构中。前一个组件允许代理商在不确定状态的存在下首次寻求顾问干预，而后者则确定了前者可能遗漏的不稳定状态，尤其是在环境变化时，然后学会了促进对此类国家的询问行动。对固定环境和非平稳环境以及不同参与者 - 评分骨架的实验结果表明，所提出的框架显着提高了代理的学习效率，并与连续顾问监控获得的框架与表现相同。

translated by 谷歌翻译

Debiasing Learning for Membership Inference Attacks Against Recommender Systems

Zihan Wang , Na Huang , Fei Sun , Pengjie Ren , Zhumin Chen , Hengliang Luo , Maarten de Rijke , Zhaochun Ren

分类：机器学习

2022-06-24

学习的推荐系统可能会无意间泄露有关其培训数据的信息，从而导致侵犯隐私行为。我们调查了推荐系统通过成员推理面临的隐私威胁。在这种攻击中，对手旨在推断用户的数据是否用于训练目标推荐人。为了实现这一目标，以前的工作使用了阴影推荐人来为攻击模型得出训练数据，然后通过计算用户历史互动和推荐项目之间的差异向量来预测成员资格。最先进的方法面临两个具有挑战性的问题：（1）由于阴影和目标推荐人之间的差距，攻击模型的培训数据偏见，并且（2）推荐人中的隐藏状态没有观察到，导致估计不准确差矢量。为了解决上述局限性，我们提出了针对推荐系统（DL-MIA）框架的成员推理攻击的偏见学习，该框架具有四个主要组件：（1）差异向量生成器，（2）分发式编码器，（3）重量估算器和（4）攻击模型。为了减轻推荐人之间的差距，设计了基于变异的自动编码器（VAE）的分解编码器，以识别推荐人不变和特定功能。为了减少估计偏差，我们设计了一个权重估计器，为每个差异向量分配了真实级别的得分，以指示估计精度。我们对三个现实世界数据集的一般推荐人和顺序推荐人评估了DL-MIA。实验结果表明，DL-MIA有效地减轻了同时减轻培训和估计的偏见，并实现了最先进的攻击性能。

translated by 谷歌翻译

Revisiting the role of heterophily in graph representation learning: An edge classification perspective

Jincheng Huang , Ping Li , Rui Huang , Chen Na , Acong Zhang

分类：机器学习

2022-05-23

图表学习目的旨在将节点内容与图形结构集成以学习节点/图表示。然而，发现许多现有的图形学习方法在具有高异性级别的数据上不能很好地工作，这是不同类标签之间很大比例的边缘。解决这个问题的最新努力集中在改善消息传递机制上。但是，尚不清楚异质性是否确实会损害图神经网络（GNNS）的性能。关键是要展现一个节点与其直接邻居之间的关系，例如它们是异性还是同质性？从这个角度来看，我们在这里研究了杂质表示在披露连接节点之间的关系之前/之后的杂音表示的作用。特别是，我们提出了一个端到端框架，该框架既学习边缘的类型（即异性/同质性），并利用边缘类型的信息来提高图形神经网络的表现力。我们以两种不同的方式实施此框架。具体而言，为了避免通过异质边缘传递的消息，我们可以通过删除边缘分类器鉴定的异性边缘来优化图形结构。另外，可以利用有关异性邻居的存在的信息进行特征学习，因此，设计了一种混合消息传递方法来汇总同质性邻居，并根据边缘分类使异性邻居多样化。广泛的实验表明，在整个同质级别的多个数据集上，通过在多个数据集上提出的框架对GNN的绩效提高了显着提高。

translated by 谷歌翻译

Shape from Polarization for Complex Scenes in the Wild

Chenyang Lei , Chenyang Qi , Jiaxin Xie , Na Fan , Vladlen Koltun , Qifeng Chen

分类：计算机视觉

2021-12-21

我们介绍了一种新的数据驱动方法，具有基于物理的前沿，从单个偏振图像到场景级正常估计。来自偏振（SFP）的现有形状主要专注于估计单个物体的正常，而不是野外的复杂场景。高质量场景级SFP的关键障碍是复杂场景中缺乏现实世界的SFP数据。因此，我们贡献了第一个现实世界场景级SFP数据集，具有配对输入偏振图像和地理正常映射。然后，我们提出了一种基于学习的框架，具有多头自我注意模块和观察编码，该框架被设计为处理由场景级SFP中的复杂材料和非正交投影引起的增加的偏振模糊。由于偏振光和表面法线之间的关系不受距离的影响，我们训练的模型可以广泛地展开到远场户外场景。实验结果表明，我们的方法在两个数据集中显着优于现有的SFP模型。我们的数据集和源代码将公开可用于\ url {https://github.com/chenyanglei/sfp-wild}。

translated by 谷歌翻译

Imbalanced Sample Generation and Evaluation for Power System Transient Stability Using CTGAN

Gengshi Han , Shunyu Liu , Kaixuan Chen , Na Yu , Zunlei Feng , Mingli Song

分类：机器学习

2021-12-16

虽然深度学习在电力系统的瞬态稳定性评估方面取得了令人印象深刻的进步，但不足和不平衡的样本仍然捕获数据驱动方法的培训效果。本文提出了一种基于条件平板生成的对冲网络（CTGAN）的可控样本生成框架，以产生指定的瞬态稳定性样本。为了适应瞬态稳定性样本的复杂特征分布，所提出的框架首先将样本模拟为表格数据，并使用高斯混合模型来标准化表格数据。然后我们将多个条件转换为单个条件向量，以实现多条件生成。此外，本文介绍了三个评估度量，以验证基于所提出的框架的产生样本的质量。 IEEE 39总线系统上的实验结果表明，该框架有效地平衡了瞬态稳定性样本，并显着提高了瞬态稳定性评估模型的性能。

translated by 谷歌翻译

Distribution Knowledge Embedding for Graph Pooling

Kaixuan Chen , Jie Song , Shunyu Liu , Na Yu , Zunlei Feng , Gengshi Han , Mingli Song

分类：机器学习 | 人工智能

2021-09-29

图级表示学习是在整个图表上操作的下游任务的关键步骤。迄今为止，解决此问题的最常见方法是图形池，通常将节点特征取平均或求和以获取图表表示。但是，汇总操作如平均或总结不可避免地会导致大量信息缺失，这可能会严重降低最终性能。在本文中，我们认为对图形下游任务至关重要的是什么不仅包括拓扑结构，还包括对节点采样的分布。因此，由现有图形神经网络（GNN）提供动力，我们提出了一个新的插件池模块，称为分布知识嵌入（DKEPOOL），在其中，将图作为GNNS顶部的发行版改造为分布，池的目标是汇总目标。整个分发信息，而不是通过简单的预定池操作保留特定矢量。事实上，DKEPOOL网络将表示形式分为两个阶段，结构学习和分布学习。结构学习遵循递归邻域聚合方案，以更新获得结构信息的节点特征。另一方面，分布学习省略了节点互连，并更多地关注所有节点所描绘的分布。广泛的实验表明，提出的Dkepool显着且始终如一地优于最新方法。

translated by 谷歌翻译

AutoVideo: An Automated Video Action Recognition System

Daochen Zha , Zaid Pervaiz Bhat , Yi-Wei Chen , Yicheng Wang , Sirui Ding , Jiaben Chen , Kwei-Herng Lai , Mohammad Qazim Bhat , Anmoll Kumar Jain , Alfredo Costilla Reyes

分类：计算机视觉 | 机器学习

2021-08-09

动作识别是通过广泛应用程序进行视频理解的重要任务。但是，开发有效的动作识别解决方案通常需要进行广泛的工程工作，以构建和测试模块及其超参数的不同组合。在此演示中，我们提出了Autovideo，这是一种用于自动视频动作识别的Python系统。Autovideo的特征是1）标准管道语言之后的高度模块化和可扩展的基础架构，2）管道构造的原始列表，3）数据驱动的调谐器来保存管道调整的努力，4）易于使用图形用户界面（GUI）。Autovideo在MIT许可证上发行，网址为https://github.com/datamllab/autovideo

translated by 谷歌翻译