智能论文笔记

Revisiting Weak-to-Strong Consistency in Semi-Supervised Semantic Segmentation

Lihe Yang , Lei Qi , Litong Feng , Wayne Zhang , Yinghuan Shi

分类：计算机视觉

2022-08-21

在这项工作中，我们重新审视了弱到较强的一致性框架，该框架由半监视分类的FixMatch推广，在该分类中，对弱扰动的图像的预测可作为其强烈扰动版本的监督。有趣的是，我们观察到，这种简单的管道已经转移到我们的细分方案时已经在最近的高级工作中取得了竞争成果。它的成功在很大程度上依赖于强大数据增强的手动设计，但是，这可能是有限的，并且不足以探索更广泛的扰动空间。在此激励的情况下，我们提出了一个辅助特征扰动流作为补充，从而导致了扩大的扰动空间。另一方面，为了充分探测原始的图像级增强，我们提出了一种双流扰动技术，从而使两个强大的观点能够同时受到共同的弱视图的指导。因此，我们整体统一的双流扰动方法（Unipatch）在Pascal，CityScapes和Coco基准的所有评估方案中都显着超过所有现有方法。我们还证明了我们方法在遥感解释和医学图像分析中的优越性。代码可从https://github.com/liheyoung/unimatch获得。

translated by 谷歌翻译

MultiMatch: Multi-task Learning for Semi-supervised Domain Generalization

Lei Qi , Hongpeng Yang , Yinghuan Shi , Xin Geng

分类：计算机视觉

2022-08-11

域的概括（DG）旨在学习一个对源域的模型，以很好地概括看不见的目标域。尽管它取得了巨大的成功，但大多数现有方法都需要用于源域中所有培训样本的标签信息，这在现实世界中既耗时又昂贵。在本文中，我们求助于解决半监督域的概括（SSDG）任务，其中每个源域中都有一些标签信息。为了解决任务，我们首先分析多域学习的理论，该理论强调了1）减轻域间隙的影响和2）利用所有样品训练模型可以有效地减少每个源域中的概括误差，因此提高伪标签的质量。根据分析，我们提出了Multimatch，即将FixMatch扩展到多任务学习框架，从而为SSDG生成高质量的伪标签。具体来说，我们将每个培训域视为一个任务（即本地任务），并将所有培训域（即全球任务）组合在一起，以训练看不见的测试域的额外任务。在多任务框架中，我们为每个任务使用独立的BN和分类器，这可以有效地减轻伪标记期间不同领域的干扰。同样，共享框架中的大多数参数，可以通过所有培训样本进行培训。此外，为了进一步提高伪标签的准确性和模型的概括，我们分别在培训和测试过程中分别融合了全球任务和本地任务的预测。一系列实验验证了所提出的方法的有效性，并且在几个基准DG数据集上优于现有的半监督方法和SSDG方法。

translated by 谷歌翻译

RDA: Reciprocal Distribution Alignment for Robust SSL

Yue Duan , Lei Qi , Lei Wang , Luping Zhou , Yinghuan Shi

分类：机器学习 | 计算机视觉

2022-08-09

在这项工作中，我们建议相互分布对准（RDA）解决半监督学习（SSL），该学习是一个无主参数框架，与置信阈值无关，并与匹配的（常规）和不匹配的类别分布一起工作。分布不匹配是一个经常被忽略但更通用的SSL场景，在该场景中，标记和未标记的数据不属于相同的类别分布。这可能导致该模型不利用标记的数据可靠，并大大降低SSL方法的性能，而传统的分布对齐无法挽救。在RDA中，我们对来自两个分类器的预测分布进行了相互对准，这些分类器预测了未标记的数据上的伪标签和互补标签。携带补充信息的这两个分布可用于相互正规化，而无需任何课堂分布。此外，我们从理论上显示RDA最大化输入输出互信息。我们的方法在各种不匹配的分布以及常规匹配的SSL设置的情况下，在SSL中实现了有希望的性能。我们的代码可在以下网址提供：https：//github.com/njuyued/rda4robustssl。

translated by 谷歌翻译

Generalizable Medical Image Segmentation via Random Amplitude Mixup and Domain-Specific Image Restoration

Ziqi Zhou , Lei Qi , Yinghuan Shi

分类：计算机视觉

2022-08-08

对于医学图像分析，在一个或几个领域训练的分割模型由于不同数据采集策略之间的差异而缺乏概括性的能力，无法看不见域。我们认为，分割性能的退化主要归因于过度拟合源域和域移位。为此，我们提出了一种新颖的可推广医学图像分割方法。要具体而言，我们通过将分割模型与自学域特异性图像恢复（DSIR）模块相结合，将方法设计为多任务范式。我们还设计了一个随机的振幅混音（RAM）模块，该模块结合了不同域图像的低级频率信息以合成新图像。为了指导我们的模型对域转移有抵抗力，我们引入了语义一致性损失。我们证明了我们在医学图像中两个可公开的分段基准测试中的方法的性能，这证实了我们的方法可以实现最先进的性能。

translated by 谷歌翻译

Label Distribution Learning for Generalizable Multi-source Person Re-identification

Lei Qi , Jiaying Shen , Jiaqi Liu , Yinghuan Shi , Xin Geng

分类：计算机视觉

2022-04-12

人重新识别（RE-ID）是视频监视系统中的一项关键技术，在监督环境中取得了重大成功。但是，由于可用源域和看不见的目标域之间的域间隙，很难将监督模型直接应用于任意看不见的域。在本文中，我们提出了一种新颖的标签分布学习（LDL）方法，以解决可推广的多源人员重新ID任务（即，有多个可用的源域，并且在培训期间看不到测试域），旨在旨在探索不同类别的关系，并减轻跨不同域的域转移，以改善模型的歧视并同时学习域不变特征。具体而言，在培训过程中，我们通过在线方式生产标签分布来挖掘不同类别的关系信息，因此它有益于提取判别特征。此外，对于每个类别的标签分布，我们进一步对其进行了修改，以更多和同等的关注该类不属于的其他域，这可以有效地减少跨不同域的域间隙并获得域不变特征。此外，我们还提供了理论分析，以证明所提出的方法可以有效地处理域转移问题。在多个基准数据集上进行的广泛实验验证了所提出的方法的有效性，并表明所提出的方法可以胜过最先进的方法。此外，进一步的分析还揭示了所提出的方法的优越性。

translated by 谷歌翻译

MutexMatch: Semi-Supervised Learning with Mutex-Based Consistency Regularization

Yue Duan , Zhen Zhao , Lei Qi , Lei Wang , Luping Zhou , Yinghuan Shi , Yang Gao

分类：计算机视觉 | 机器学习

2022-03-27

The core issue in semi-supervised learning (SSL) lies in how to effectively leverage unlabeled data, whereas most existing methods tend to put a great emphasis on the utilization of high-confidence samples yet seldom fully explore the usage of low-confidence samples. In this paper, we aim to utilize low-confidence samples in a novel way with our proposed mutex-based consistency regularization, namely MutexMatch. Specifically, the high-confidence samples are required to exactly predict "what it is" by conventional True-Positive Classifier, while the low-confidence samples are employed to achieve a simpler goal -- to predict with ease "what it is not" by True-Negative Classifier. In this sense, we not only mitigate the pseudo-labeling errors but also make full use of the low-confidence unlabeled data by consistency of dissimilarity degree. MutexMatch achieves superior performance on multiple benchmark datasets, i.e., CIFAR-10, CIFAR-100, SVHN, STL-10, mini-ImageNet and Tiny-ImageNet. More importantly, our method further shows superiority when the amount of labeled data is scarce, e.g., 92.23% accuracy with only 20 labeled data on CIFAR-10. Our code and model weights have been released at https://github.com/NJUyued/MutexMatch4SSL.

translated by 谷歌翻译

A Novel Mix-normalization Method for Generalizable Multi-source Person Re-identification

Lei Qi , Lei Wang , Yinghuan Shi , Xin Geng

分类：计算机视觉

2022-01-24

人重新识别（RE-ID）在监督场景中取得了巨大成功。但是，由于模型过于适合所见源域，因此很难将监督模型直接传输到任意看不见的域。在本文中，我们旨在从数据增强的角度来解决可推广的多源人员重新ID任务（即，在培训期间看不见测试域，并且在培训期间看不见测试域，因此我们提出了一种新颖的方法，称为Mixnorm，由域感知的混合范围（DMN）和域软件中心正则化（DCR）组成。不同于常规数据增强，提出的域吸引的混合范围化，以增强从神经网络的标准化视图中训练期间特征的多样性，这可以有效地减轻模型过度适应源域，从而提高概括性。在看不见的域中模型的能力。为了更好地学习域不变的模型，我们进一步开发了域吸引的中心正规化，以更好地将产生的各种功能映射到同一空间中。在多个基准数据集上进行的广泛实验验证了所提出的方法的有效性，并表明所提出的方法可以胜过最先进的方法。此外，进一步的分析还揭示了所提出的方法的优越性。

translated by 谷歌翻译

More is Better: A Novel Multi-view Framework for Domain Generalization

Jian Zhang , Lei Qi , Yinghuan Shi , Yang Gao

分类：计算机视觉

2021-12-23

旨在概括在源域中训练的模型来看不见的目标域，域泛化（DG）最近引起了很多关注。 DG的关键问题是如何防止对观察到的源极域的过度接收，因为在培训期间目标域不可用。我们调查过度拟合不仅导致未经看不见的目标域的普遍推广能力，而且在测试阶段导致不稳定的预测。在本文中，我们观察到，在训练阶段采样多个任务并在测试阶段产生增强图像，很大程度上有利于泛化性能。因此，通过处理不同视图的任务和图像，我们提出了一种新颖的多视图DG框架。具体地，在训练阶段，为了提高泛化能力，我们开发了一种多视图正则化元学习算法，该算法采用多个任务在更新模型期间产生合适的优化方向。在测试阶段，为了减轻不稳定的预测，我们利用多个增强图像来产生多视图预测，这通过熔断测试图像的不同视图的结果显着促进了模型可靠性。三个基准数据集的广泛实验验证了我们的方法优于几种最先进的方法。

translated by 谷歌翻译

Generalizable Cross-modality Medical Image Segmentation via Style Augmentation and Dual Normalization

Ziqi Zhou , Lei Qi , Xin Yang , Dong Ni , Yinghuan Shi

分类：计算机视觉

2021-12-21

对于医学图像分割，想象一下，如果仅使用源域中的MR图像训练模型，它的性能如何直接在目标域中进行CT图像？这种设置，即概括的跨模块分割，拥有其临床潜力，其比其他相关设置更具挑战性，例如域适应。为实现这一目标，我们本文通过利用在我们更广泛的分割期间利用增强的源相似和源不同的图像来提出新的双标准化模块。具体而言，给定单个源域，旨在模拟未经证明的目标域中可能的外观变化，我们首先利用非线性变换来增加源相似和源不同的图像。然后，为了充分利用这两种类型的增强，我们所提出的基于双重定量的模型采用共享骨干但独立的批量归一化层，用于单独归一化。之后，我们提出了一种基于风格的选择方案来自动选择测试阶段的适当路径。在三个公开可用的数据集上进行了广泛的实验，即Brats，跨型心脏和腹部多器官数据集表明我们的方法优于其他最先进的域概括方法。

translated by 谷歌翻译

Domain Generalization via Progressive Layer-wise and Channel-wise Dropout

Jintao Guo , Lei Qi , Yinghuan Shi , Yang Gao

分类：机器学习 | 计算机视觉

2021-12-07

通过在多个观察到的源极域上培训模型，域概括旨在概括到无需进一步培训的任意看不见的目标领域。现有的作品主要专注于学习域不变的功能，以提高泛化能力。然而，由于在训练期间不可用目标域，因此前面的方法不可避免地遭受源极域中的过度。为了解决这个问题，我们开发了一个有效的基于辍学的框架，可以扩大模型的注意力，这可以有效地减轻过度的问题。特别地，与典型的辍学方案不同，通常在固定层上进行丢失，首先，我们随机选择一层，然后我们随机选择其通道以进行丢弃。此外，我们利用进步方案增加训练期间辍学的比率，这可以逐步提高培训模型的难度，以增强模型的稳健性。此外，为了进一步缓解过度拟合问题的影响，我们利用了在图像级和特征级别的增强方案来产生强大的基线模型。我们对多个基准数据集进行广泛的实验，该数据集显示了我们的方法可以优于最先进的方法。

translated by 谷歌翻译