智能论文笔记

Point Cloud Registration-Driven Robust Feature Matching for 3D Siamese Object Tracking

Haobo Jiang , Kaihao Lan , Le Hui , Guangyu Li , Jin Xie , Jian Yang

分类：计算机视觉 | 人工智能

2022-09-14

在模板和搜索区域之间学习强大的功能匹配对于3D暹罗跟踪至关重要。暹罗功能匹配的核心是如何在模板和搜索区域之间的相应点上分配高特征相似性，以进行精确的对象本地化。在本文中，我们提出了一个新颖的点云登记驱动的暹罗跟踪框架，直觉是空间对齐相应点（通过3D注册）倾向于实现一致的特征表示。具体而言，我们的方法由两个模块组成，包括特定于特定的非局部注册模块和一个注册辅助的sindhorn模板 - 特征聚合模块。登记模块在模板和搜索区域之间的精确空间对齐中进行目标。提出了跟踪特异性的空间距离约束，以优化非局部模块中的交叉注意权重，以进行判别特征学习。然后，我们使用加权SVD来计算模板和搜索区域之间的刚性转换，并对齐它们以实现所需的空间对齐相应点。对于特征聚合模型，我们将转换模板和搜索区域之间的特征匹配作为最佳传输问题，并利用Sinkhorn优化来搜索异常型匹配匹配解决方案。同样，建造了登记辅助空间距离图，以改善无法区分的区域（例如光滑的表面）的匹配鲁棒性。最后，在获得的功能匹配地图的指导下，我们将目标信息从模板中汇总到搜索区域中以构建特定于目标的特征，然后将其馈送到一个类似中心点的检测头中以进行对象定位。关于Kitti，Nuscenes和Waymo数据集的广泛实验验证了我们提出的方法的有效性。

translated by 谷歌翻译

GCNear: A Hybrid Architecture for Efficient GCN Training with Near-Memory Processing

Zhe Zhou , Cong Li , Xuechao Wei , Guangyu Sun

分类：机器学习

2021-11-01

最近，图形卷积网络（GCNS）已成为用于分析非欧几里德图数据的最先进的算法。然而，实现有效的GCN训练，特别是在大图中挑战。原因是许多折叠的原因：1）GCN训练引发了大量的内存占用。大图中的全批量培训甚至需要数百到数千千兆字节的内存，以缓冲中间数据进行反向传播。 2）GCN培训涉及内存密集型数据减少和计算密集型功能/渐变更新操作。这种异构性质挑战当前的CPU / GPU平台。 3）图形的不规则性和复杂的训练数据流共同增加了提高GCN培训系统效率的难度。本文提出了一种混合架构来解决这些挑战的混合架构。具体地，GCNEAR采用基于DIMM的存储系统，提供易于级别的存储器容量。为了匹配异构性质，我们将GCN培训操作分类为内存密集型减少和计算密集型更新操作。然后，我们卸载将操作减少到DIMM NMES，充分利用高聚合的本地带宽。我们采用具有足够计算能力的CAE来处理更新操作。我们进一步提出了几种优化策略来处理GCN任务的不规则，提高GCNEAR的表现。我们还提出了一种多GCNEAR系统来评估GCNEAR的可扩展性。

translated by 谷歌翻译

GNNSampler: Bridging the Gap between Sampling Algorithms of GNN and Hardware

Xin Liu , Mingyu Yan , Shuhan Song , Zhengyang Lv , Wenming Li , Guangyu Sun , Xiaochun Ye , Dongrui Fan

分类：机器学习

2021-08-26

采样是图形神经网络（GNN）培训的关键操作，有助于降低成本。以前的文献已经通过数学和统计方法探索了改进采样算法。但是，采样算法和硬件之间存在差距。在不考虑硬件的情况下，算法设计人员仅在算法级别优化采样，缺少通过利用硬件功能来促进现有采样算法效率的巨大潜力。在本文中，我们开创了一个为主流采样算法提出的统一编程模型，称为GNNSampler，涵盖了各个类别中采样算法的关键过程。其次，为了利用硬件功能，我们选择数据局部性作为案例研究，并在图中探索节点及其邻居之间的数据位置，以减轻采样中不规则的内存访问。第三，我们在GNNSampler中实现了各种采样算法的局部感知优化，以优化一般的采样过程。最后，我们强调在大图数据集上进行实验，以分析训练时间，准确性和硬件级指标之间的相关性。广泛的实验表明，我们的方法通用到主流采样算法，并有助于大大减少训练时间，尤其是在大规模图中。

translated by 谷歌翻译

Backdoor Vulnerabilities in Normally Trained Deep Learning Models

Guanhong Tao , Zhenting Wang , Siyuan Cheng , Shiqing Ma , Shengwei An , Yingqi Liu , Guangyu Shen , Zhuo Zhang , Yunshu Mao , Xiangyu Zhang

分类：机器学习

2022-11-29

We conduct a systematic study of backdoor vulnerabilities in normally trained Deep Learning models. They are as dangerous as backdoors injected by data poisoning because both can be equally exploited. We leverage 20 different types of injected backdoor attacks in the literature as the guidance and study their correspondences in normally trained models, which we call natural backdoor vulnerabilities. We find that natural backdoors are widely existing, with most injected backdoor attacks having natural correspondences. We categorize these natural backdoors and propose a general detection framework. It finds 315 natural backdoors in the 56 normally trained models downloaded from the Internet, covering all the different categories, while existing scanners designed for injected backdoors can at most detect 65 backdoors. We also study the root causes and defense of natural backdoors.

translated by 谷歌翻译

Homophone Reveals the Truth: A Reality Check for Speech2Vec

Guangyu Chen

分类：自然语言处理

2022-09-22

生成具有语义信息的口语嵌入是一个引人入胜的话题。与基于文本的嵌入相比，它们涵盖了语音和语义特征，它们可以提供更丰富的信息，并可能有助于改善ASR和语音翻译系统。在本文中，我们审查并研究了该领域开创性工作的真实性：Specy2Vec。首先，提出了一种基于谐音的检查方法来检查Secembor2Vec作者发布的语音嵌入。没有迹象表明这些嵌入是由Speech2VEC模型生成的。此外，通过对词汇组成的进一步分析，我们怀疑基于文本的模型可以制造这些嵌入。最后，我们重现了Secem2VEC模型，指的是原始论文中的官方代码和最佳设置。实验表明，该模型未能学习有效的语义嵌入。在单词相似性基准中，男性的相关得分为0.08，WS-353-SIM测试的相关得分为0.15，比原始论文中所述的相关得分为0.5。我们的数据和代码可用。

translated by 谷歌翻译

Improving COVID-19 CT Classification of CNNs by Learning Parameter-Efficient Representation

Yujia Xu , Hak-Keung Lam , Guangyu Jia , Jian Jiang , Junkai Liao , Xinqi Bao

分类：计算机视觉

2022-08-09

Covid-19-Pandemic继续在世界上迅速传播，并在全球人类健康和经济中造成巨大危机。它的早期检测和诊断对于控制进一步的扩散至关重要。已经提出了许多基于学习的深度方法，以帮助临床医生根据计算机断层扫描成像进行自动COVID-19诊断。但是，仍然存在挑战，包括现有数据集中的数据多样性，以及由于深度学习模型的准确性和敏感性不足而导致的检测不满意。为了增强数据多样性，我们设计了增量级别的增强技术，并将其应用于最大的开放式基准测试数据集Covidx CT-2A。同时，在本研究中提出了从对比度学习中得出的相似性正则化（SR），以使CNN能够学习更多参数有效的表示，从而提高了CNN的准确性和敏感性。七个常用CNN的结果表明，通过应用设计的增强和SR技术，可以稳定地提高CNN性能。特别是，具有SR的Densenet121在三个试验中的三类分类中达到99.44％的平均测试准确性，包括正常，非covid-19-19-19肺炎和Covid-19-19。 COVID-19肺炎类别的精确度，敏感性和特异性分别为98.40％，99.59％和99.50％。这些统计数据表明，我们的方法已经超过了COVIDX CT-2A数据集上现有的最新方法。

translated by 谷歌翻译

Multi-objective Optimization of Notifications Using Offline Reinforcement Learning

Prakruthi Prabhakar , Yiping Yuan , Guangyu Yang , Wensheng Sun , Ajith Muralidharan

分类：机器学习 | (统计)机器学习

2022-07-07

移动通知系统在各种应用程序中起着重要作用，以通信，向用户发送警报和提醒，以告知他们有关新闻，事件或消息的信息。在本文中，我们将近实时的通知决策问题制定为马尔可夫决策过程，在该过程中，我们对奖励中的多个目标进行了优化。我们提出了一个端到端的离线增强学习框架，以优化顺序通知决策。我们使用基于保守的Q学习的双重Q网络方法来应对离线学习的挑战，从而减轻了分配转移问题和Q值高估。我们说明了完全部署的系统，并通过离线和在线实验证明了拟议方法的性能和好处。

translated by 谷歌翻译

DECK: Model Hardening for Defending Pervasive Backdoors

Guanhong Tao , Yingqi Liu , Siyuan Cheng , Shengwei An , Zhuo Zhang , Qiuling Xu , Guangyu Shen , Xiangyu Zhang

分类：人工智能 | 计算机视觉 | 机器学习

2022-06-18

普遍的后门是由动态和普遍的输入扰动触发的。它们可以被攻击者故意注射，也可以自然存在于经过正常训练的模型中。它们的性质与传统的静态和局部后门不同，可以通过扰动带有一些固定图案的小输入区域来触发，例如带有纯色的贴片。现有的防御技术对于传统后门非常有效。但是，它们可能对普遍的后门无法正常工作，尤其是在后门去除和模型硬化方面。在本文中，我们提出了一种针对普遍的后门，包括天然和注射后门的新型模型硬化技术。我们基于通过特殊转换层增强的编码器架构来开发一般的普遍攻击。该攻击可以对现有的普遍后门攻击进行建模，并通过类距离进行量化。因此，使用我们在对抗训练中攻击的样品可以使模型与这些后门漏洞相比。我们对9个具有15个模型结构的9个数据集的评估表明，我们的技术可以平均扩大阶级距离59.65％，精度降解且没有稳健性损失，超过了五种硬化技术，例如对抗性训练，普遍的对抗训练，Moth，Moth等，。它可以将六次普遍后门攻击的攻击成功率从99.06％降低到1.94％，超过七种最先进的后门拆除技术。

translated by 谷歌翻译

A Non-Classical Parameterization for Density Estimation Using Sample Moments

Guangyu Wu , Anders Lindquist

分类： (统计)机器学习 | 机器学习

2022-01-13

瞬间方法是密度估计的重要手段，但它们通常强烈依赖于可行功能的选择，这严重影响了性能。我们提出了使用样本矩阵的密度估计的非古典参数化，这不需要选择这种功能。参数化由kullback-leibler距离引起，并且它被证明存在并且是在不依赖于数据的简单的简单之前存在的解决方案，可以通过凸优化获得。仿真结果表明，所提出的估计估计估计多种模态密度的性能，这些估计是不同类型功能的混合物。

translated by 谷歌翻译

Pixel Distillation: A New Knowledge Distillation Scheme for Low-Resolution Image Recognition

Guangyu Guo , Longfei Han , Junwei Han , Dingwen Zhang

分类：计算机视觉 | 机器学习

2021-12-17

深度学习的巨大成功主要是由于大规模的网络架构和高质量的培训数据。但是，在具有有限的内存和成像能力的便携式设备上部署最近的深层模型仍然挑战。一些现有的作品通过知识蒸馏进行了压缩模型。不幸的是，这些方法不能处理具有缩小图像质量的图像，例如低分辨率（LR）图像。为此，我们采取了开创性的努力，从高分辨率（HR）图像到达将处理LR图像的紧凑型网络模型中学习的繁重网络模型中蒸馏有用的知识，从而推动了新颖的像素蒸馏的当前知识蒸馏技术。为实现这一目标，我们提出了一名教师助理 - 学生（TAS）框架，将知识蒸馏分解为模型压缩阶段和高分辨率表示转移阶段。通过装备新颖的特点超分辨率（FSR）模块，我们的方法可以学习轻量级网络模型，可以实现与重型教师模型相似的准确性，但参数更少，推理速度和较低分辨率的输入。在三个广泛使用的基准，\即，幼崽200-2011，Pascal VOC 2007和ImageNetsub上的综合实验证明了我们方法的有效性。

translated by 谷歌翻译