智能论文笔记

MemSAC: Memory Augmented Sample Consistency for Large Scale Domain Adaptation

Tarun Kalluri , Astuti Sharma , Manmohan Chandraker

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-25

实用的现实世界数据集具有丰富的类别，为无监督的领域适应带来了新的挑战，例如小型阶层歧视性，仅依靠域不变性的现有方法不能很好地处理。在这项工作中，我们提出了MEMSAC，该MEMSAC利用了跨源和目标域的样本级别相似性，以实现判别性转移，以及扩展到大量类别的体系结构。为此，我们首先引入一种内存增强方法，以在标记的源和未标记的目标域实例之间有效提取成对的相似性关系，该实例适用于处理任意数量的类。接下来，我们建议和理论上证明对比损失的新型变体，以促进阶层内跨域样本之间的局部一致性，同时在类别之间执行分离，从而保留从源到目标的歧视性转移。我们验证了MEMSAC的优势，比以前的最先进的最先进的转移任务有了显着改进。我们还提供了深入的分析和对MEMSAC有效性的见解。

translated by 谷歌翻译

Transferrable Contrastive Learning for Visual Domain Adaptation

Yang Chen , Yingwei Pan , Yu Wang , Ting Yao , Xinmei Tian , Tao Mei

分类：计算机视觉 | 人工智能

2021-12-14

自我监督的学习（SSL）最近成为特征学习方法中的最爱。因此，它可以吸引域适应方法来考虑结合SSL。直觉是强制执行实例级别一致性，使得预测器在域中变得不变。但是，域适应制度中的大多数现有SSL方法通常被视为独立的辅助组件，使域自适应的签名无人看管。实际上，域间隙消失的最佳区域和SSL PERUSES的实例级别约束可能根本不一致。从这一点来看，我们向一个特定的范式的自我监督学习量身定制，用于域适应，即可转让的对比学习（TCL），这与SSL和所需的跨域转移性相一致地联系起来。我们发现对比学习本质上是一个合适的域适应候选者，因为它的实例不变性假设可以方便地促进由域适应任务青睐的跨域类级不变性。基于特定的记忆库结构和伪标签策略，TCL然后通过清洁和新的对比损失来惩罚源头和靶之间的跨域内域差异。免费午餐是由于纳入对比学习，TCL依赖于移动平均的关键编码器，自然地实现了用于目标数据的伪标签的暂停标签，这避免了无额外的成本。因此，TCL有效地减少了跨域间隙。通过对基准（Office-Home，Visda-2017，Diamet-Five，PACS和Domainnet）进行广泛的实验，用于单源和多源域适配任务，TCL已经证明了最先进的性能。

translated by 谷歌翻译

Semi-Supervised Domain Adaptation by Similarity based Pseudo-label Injection

Abhay Rawat , Isha Dua , Saurav Gupta , Rahul Tallamraju

分类：计算机视觉

2022-09-05

半监督域适应性（SSDA）中的主要挑战之一是标记源和目标样本数量之间的偏差比，导致该模型偏向源域。 SSDA中的最新作品表明，仅将标记的目标样品与源样本对齐可能导致目标域与源域的不完全域对齐。在我们的方法中，为了使两个域对齐，我们利用对比的损失，使用来自两个域的监督样本学习语义上有意义的域不可知特征空间。为了减轻偏斜标签比率引起的挑战，我们通过将其特征表示形式与来自源和目标域的标记样品的特征表示形式进行比较，为未标记的目标样本进行了伪造。此外，为了增加目标域的支持，在训练过程中，这些潜在的嘈杂的伪标签逐渐被逐渐注入标记的目标数据集中。具体而言，我们使用温度缩放的余弦相似性度量将软伪标签分配给未标记的目标样品。此外，我们计算每个未标记样品的软伪标签的指数移动平均值。这些伪标签逐渐注入或删除）（从）基于置信阈值（以补充源和目标分布的比对）（从）中（从）中。最后，我们在标记和伪标记的数据集上使用有监督的对比损失来对齐源和目标分布。使用我们提出的方法，我们在SSDA基准测试中展示了最先进的性能-Office-Home，Domainnet和Office-31。

translated by 谷歌翻译

Domain Adaptation with Auxiliary Target Domain-Oriented Classifier

Jian Liang , Dapeng Hu , Jiashi Feng

分类：计算机视觉 | 机器学习

2020-07-08

域适应（DA）旨在将知识从标签富裕但异构的域转移到标签恐慌域，这减轻了标签努力并吸引了相当大的关注。与以前的方法不同，重点是学习域中的特征表示，一些最近的方法存在通用半监督学习（SSL）技术，直接将它们应用于DA任务，甚至实现竞争性能。最受欢迎的SSL技术之一是伪标记，可通过标记数据训练的分类器为每个未标记数据分配伪标签。但是，它忽略了DA问题的分布偏移，并且不可避免地偏置为源数据。要解决此问题，我们提出了一个名为辅助目标域导向的分类器（ATDOC）的新伪标签框架。 ATDOC通过为目标数据引入辅助分类器来缓解分类器偏置，以提高伪标签的质量。具体地，我们使用内存机制并开发两种类型的非参数分类器，即最近的质心分类器和邻域聚合，而不引入任何其他网络参数。尽管在伪分类目标中具有简单性，但具有邻域聚集的ATDOC显着优于域对齐技术和现有的SSL技术，以及甚至瘢痕标记的SSL任务。

translated by 谷歌翻译

Concurrent Subsidiary Supervision for Unsupervised Source-Free Domain Adaptation

Jogendra Nath Kundu , Suvaansh Bhambri , Akshay Kulkarni , Hiran Sarkar , Varun Jampani , R. Venkatesh Babu

分类：计算机视觉 | 机器学习

2022-07-27

无监督的域适应性（DA）中的主要挑战是减轻源域和目标域之间的域移动。先前的DA工作表明，可以使用借口任务来通过学习域不变表示来减轻此域的转移。但是，实际上，我们发现大多数现有的借口任务对其他已建立的技术无效。因此，我们从理论上分析了如何以及何时可以利用子公司借口任务来协助给定DA问题的目标任务并制定客观的子公司任务适用性标准。基于此标准，我们设计了一个新颖的贴纸干预过程和铸造贴纸分类的过程，作为监督的子公司DA问题，该问题与目标任务无监督的DA同时发生。我们的方法不仅改善了目标任务适应性能，而且还促进了面向隐私的无源DA，即没有并发源目标访问。标准Office-31，Office-Home，Domainnet和Visda基准的实验证明了我们对单源和多源无源DA的优势。我们的方法还补充了现有的无源作品，从而实现了领先的绩效。

translated by 谷歌翻译

CLDA: Contrastive Learning for Semi-Supervised Domain Adaptation

Ankit Singh

分类：计算机视觉

2021-06-30

无监督的域适应（UDA）旨在将标记的源分布与未标记的目标分布对齐，以获取域不变预测模型。然而，众所周知的UDA方法的应用在半监督域适应（SSDA）方案中不完全概括，其中来自目标域的少数标记的样本可用。在本文中，我们提出了一种用于半监督域适应（CLDA）的简单对比学习框架，该框架试图在SSDA中弥合标记和未标记的目标分布与源极和未标记的目标分布之间的域间差距之间的域间隙。我们建议采用类明智的对比学学习来降低原始（输入图像）和强大增强的未标记目标图像之间的域间间隙和实例级对比度对准，以最小化域内差异。我们已经凭经验表明，这两个模块相互补充，以实现卓越的性能。在三个众所周知的域适应基准数据集中的实验即Domainnet，Office-Home和Office31展示了我们方法的有效性。 CLDA在所有上述数据集上实现最先进的结果。

translated by 谷歌翻译

Semi-supervised Domain Adaptive Structure Learning

Can Qin , Lichen Wang , Qianqian Ma , Yu Yin , Huan Wang , Yun Fu

分类：计算机视觉 | 人工智能 | 机器学习

2021-12-12

半监督域适应（SSDA）是一种具有挑战性的问题，需要克服1）以朝向域的较差的数据和2）分布换档的方法。不幸的是，由于培训数据偏差朝标标样本训练，域适应（DA）和半监督学习（SSL）方法的简单组合通常无法解决这两个目的。在本文中，我们介绍了一种自适应结构学习方法，以规范SSL和DA的合作。灵感来自多视图学习，我们建议的框架由共享特征编码器网络和两个分类器网络组成，用于涉及矛盾的目的。其中，其中一个分类器被应用于组目标特征以提高级别的密度，扩大了鲁棒代表学习的分类集群的间隙。同时，其他分类器作为符号器，试图散射源功能以增强决策边界的平滑度。目标聚类和源扩展的迭代使目标特征成为相应源点的扩张边界内的封闭良好。对于跨域特征对齐和部分标记的数据学习的联合地址，我们应用最大平均差异（MMD）距离最小化和自培训（ST）将矛盾结构投影成共享视图以进行可靠的最终决定。对标准SSDA基准的实验结果包括Domainnet和Office-Home，展示了我们对最先进的方法的方法的准确性和稳健性。

translated by 谷歌翻译

Source Data-absent Unsupervised Domain Adaptation through Hypothesis Transfer and Labeling Transfer

Jian Liang , Dapeng Hu , Yunbo Wang , Ran He , Jiashi Feng

分类：计算机视觉 | 机器学习

2020-12-14

无监督域适应（UDA）旨在将知识从相关但不同的良好标记的源域转移到新的未标记的目标域。大多数现有的UDA方法需要访问源数据，因此当数据保密而不相配在隐私问题时，不适用。本文旨在仅使用培训的分类模型来解决现实设置，而不是访问源数据。为了有效地利用适应源模型，我们提出了一种新颖的方法，称为源假设转移（拍摄），其通过将目标数据特征拟合到冻结源分类模块（表示分类假设）来学习目标域的特征提取模块。具体而言，拍摄挖掘出于特征提取模块的信息最大化和自我监督学习，以确保目标特征通过同一假设与看不见的源数据的特征隐式对齐。此外，我们提出了一种新的标签转移策略，它基于预测的置信度（标签信息），然后采用半监督学习来将目标数据分成两个分裂，然后提高目标域中的较为自信预测的准确性。如果通过拍摄获得预测，我们表示标记转移为拍摄++。关于两位数分类和对象识别任务的广泛实验表明，拍摄和射击++实现了与最先进的结果超越或相当的结果，展示了我们对各种视域适应问题的方法的有效性。代码可用于\ url {https：//github.com/tim-learn/shot-plus}。

translated by 谷歌翻译

BMD: A General Class-balanced Multicentric Dynamic Prototype Strategy for Source-free Domain Adaptation

Sanqing Qu , Guang Chen , Jing Zhang , Zhijun Li , Wei He , Dacheng Tao

分类：计算机视觉

2022-04-06

无源域的适应（SFDA）旨在将预先培训的源模型调整到未标记的目标域而无需访问标记良好的源数据的情况下，由于数据隐私，安全性和传输问题，这是一个更实用的设置。为了弥补缺乏源数据，大多数现有方法引入了基于特征原型的伪标记策略，以实现自我训练模型的适应性。但是，特征原型是通过基于实例级预测的特征群集获得的，该特征群集是偏见的，并且倾向于导致嘈杂的标签，因为源和目标之间的视觉域间隙通常不同。此外，我们发现单中心特征原型可能无效地表示每个类别并引入负转移，尤其是对于这些硬转移数据。为了解决这些问题，我们为SFDA任务提供了一般类平衡的多中心动态原型（BMD）策略。具体而言，对于每个目标类别，我们首先引入全球类间平衡抽样策略，以汇总潜在的代表性目标样本。然后，我们设计了一类多中心聚类策略，以实现更健壮和代表性的原型生成。与在固定培训期更新伪标签的现有策略相反，我们进一步引入了动态伪标签策略，以在模型适应过程中结合网络更新信息。广泛的实验表明，所提出的模型不可替代的BMD策略显着改善了代表性的SFDA方法，以产生新的最新结果。该代码可在https://github.com/ispc-lab/bmd上找到。

translated by 谷歌翻译

Subtype-Aware Dynamic Unsupervised Domain Adaptation

Xiaofeng Liu , Fangxu Xing , Jia You , Jun Lu , C. -C. Jay Kuo , Georges El Fakhri , Jonghye Woo

分类：计算机视觉 | 人工智能 | 机器学习

2022-08-16

无监督的域适应性（UDA）已成功地应用于没有标签的标记源域转移到目标域的知识。最近引入了可转移的原型网络（TPN），进一步解决了班级条件比对。在TPN中，虽然在潜在空间中明确执行了源和目标域之间的类中心的接近度，但尚未完全研究基础的细颗粒亚型结构和跨域紧凑性。为了解决这个问题，我们提出了一种新方法，以适应性地执行细粒度的亚型意识对准，以提高目标域的性能，而无需两个域中的子类型标签。我们方法的见解是，由于不同的条件和标签变化，同类中未标记的亚型在亚型内具有局部接近性，同时表现出不同的特征。具体而言，我们建议通过使用中间伪标签同时执行亚型的紧凑度和阶级分离。此外，我们系统地研究了有或不具有亚型数字的各种情况，并建议利用基本的亚型结构。此外，开发了一个动态队列框架，以使用替代处理方案稳步地进化亚型簇质心。与最先进的UDA方法相比，使用多视图的先天性心脏病数据和VISDA和域进行了实验结果，显示了我们的亚型意识UDA的有效性和有效性。

translated by 谷歌翻译

Making the Best of Both Worlds: A Domain-Oriented Transformer for Unsupervised Domain Adaptation

Wenxuan Ma , Jinming Zhang , Shuang Li , Chi Harold Liu , Yulin Wang , Wei Li

分类：计算机视觉

2022-08-02

关于无监督的域适应性（UDA）的广泛研究已将有限的实验数据集深入学习到现实世界中无约束的领域。大多数UDA接近通用嵌入空间中的对齐功能，并将共享分类器应用于目标预测。但是，由于当域差异很大时可能不存在完全排列的特征空间，因此这些方法受到了两个局限性。首先，由于缺乏目标标签监督，强制域的比对会恶化目标域的可区分性。其次，源监督分类器不可避免地偏向源数据，因此它在目标域中的表现可能不佳。为了减轻这些问题，我们建议在两个集中在不同领域的空间中同时进行特征对齐，并为每个空间创建一个针对该域的面向域的分类器。具体而言，我们设计了一个面向域的变压器（DOT），该变压器（DOT）具有两个单独的分类令牌，以学习不同的面向域的表示形式和两个分类器，以保持域的可区分性。理论保证的基于对比度的对齐和源指导的伪标签细化策略被用来探索域名和特定信息。全面的实验验证了我们的方法在几个基准上实现了最先进的方法。

translated by 谷歌翻译

Prototype-Guided Continual Adaptation for Class-Incremental Unsupervised Domain Adaptation

Hongbin Lin , Yifan Zhang , Zhen Qiu , Shuaicheng Niu , Chuang Gan , Yanxia Liu , Mingkui Tan

分类：计算机视觉

2022-07-22

本文研究了一个新的，实用但具有挑战性的问题，称为类无监督的域名适应性（CI-UDA），其中标记的源域包含所有类别，但是未标记的目标域中的类别依次增加。由于两个困难，这个问题具有挑战性。首先，源和目标标签集在每个时间步骤都不一致，这使得很难进行准确的域对齐。其次，以前的目标类在当前步骤中不可用，从而忘记了先前的知识。为了解决这个问题，我们提出了一种新型的原型引导连续适应（PROCA）方法，由两种解决方案策略组成。 1）标签原型识别：我们通过检测具有目标样本的累积预测概率的共享类来识别目标标签原型。 2）基于原型的对齐和重播：基于确定的标签原型，我们对齐域并强制执行模型以保留先前的知识。有了这两种策略，ProCA能够有效地将源模型改编为类未标记的目标域。广泛的实验证明了Proca在解决CI-UDA方面的有效性和优势。源代码可从https://github.com/hongbin98/proca.git获得

translated by 谷歌翻译

Surprisingly Simple Semi-Supervised Domain Adaptation with Pretraining and Consistency

Samarth Mishra , Kate Saenko , Venkatesh Saligrama

分类：计算机视觉 | 机器学习

2021-01-29

大多数现代无人监督域适应（UDA）方法源于域对齐，即，学习源和目标功能，使用源标签学习目标域分类器。在半监督域适应（SSDA）中，当学习者可以访问少量目标域标签时，先前的方法遵循UDA理论以使用域对齐进行学习。我们表明SSDA的情况是不同的，并且可以在不需要对齐的情况下学习良好的目标分类器。我们使用自我监督的预测（通过旋转预测）和一致性正则化来实现良好的分开的目标集群，同时在学习低误差目标分类器时。凭借我们预先推价和一致性（PAC）方法，我们在该半监控域适应任务上实现了最新的目标准确性，超过了多个数据集的多个对抗域对齐方法。 PAC，同时使用简单的技术，对DomainNet和Visda-17等大而挑战的SSDA基准进行了非常好的，通常通过相当的边距来表现最近的艺术状态。我们的实验代码可以在https://github.com/venkatesh-saligrama/pac找到

translated by 谷歌翻译

Camera Alignment and Weighted Contrastive Learning for Domain Adaptation in Video Person ReID

Djebril Mekhazni , Maximilien Dufau , Christian Desrosiers , Marco Pedersoli , Eric Granger

分类：计算机视觉

2022-11-07

Systems for person re-identification (ReID) can achieve a high accuracy when trained on large fully-labeled image datasets. However, the domain shift typically associated with diverse operational capture conditions (e.g., camera viewpoints and lighting) may translate to a significant decline in performance. This paper focuses on unsupervised domain adaptation (UDA) for video-based ReID - a relevant scenario that is less explored in the literature. In this scenario, the ReID model must adapt to a complex target domain defined by a network of diverse video cameras based on tracklet information. State-of-art methods cluster unlabeled target data, yet domain shifts across target cameras (sub-domains) can lead to poor initialization of clustering methods that propagates noise across epochs, thus preventing the ReID model to accurately associate samples of same identity. In this paper, an UDA method is introduced for video person ReID that leverages knowledge on video tracklets, and on the distribution of frames captured over target cameras to improve the performance of CNN backbones trained using pseudo-labels. Our method relies on an adversarial approach, where a camera-discriminator network is introduced to extract discriminant camera-independent representations, facilitating the subsequent clustering. In addition, a weighted contrastive loss is proposed to leverage the confidence of clusters, and mitigate the risk of incorrect identity associations. Experimental results obtained on three challenging video-based person ReID datasets - PRID2011, iLIDS-VID, and MARS - indicate that our proposed method can outperform related state-of-the-art methods. Our code is available at: \url{https://github.com/dmekhazni/CAWCL-ReID}

translated by 谷歌翻译

Semantic-aware Representation Learning Via Probability Contrastive Loss

Junjie Li , Yixin Zhang , Zilei Wang , Keyu Tu

分类：计算机视觉

2021-11-11

最近的特征对比学习（FCL）在无监督的代表学习中表现出了有希望的表现。然而，对于近置表示学习，其中标记的数据和未标记数据属于相同的语义空间，FCL不能显示由于在优化期间不涉及类语义而无法占用的压倒性增益。因此，产生的特征不保证由来自标记数据中学到的类重量轻松归类，尽管它们是富有的信息。为了解决这个问题，我们在本文中提出了一种新颖的概率对比学习（PCL），这不仅产生了丰富的功能，而且还强制执行它们以分布在课堂上的原型。具体而言，我们建议在SoftMax之后使用输出概率来执行对比学习而不是FCL中提取的功能。显然，这种方法可以在优化期间利用类语义。此外，我们建议在传统的FCL中删除$ \ ell_ {2} $归一化，并直接使用$ \ ell_ {1} $ - 归一化对比学习的概率。我们提出的PCL简单有效。我们在三个近距离图像分类任务中进行广泛的实验，即无监督域适应，半监督学习和半监督域适应。多个数据集上的结果表明，我们的PCL可以一致地获得相当大的收益并实现所有三个任务的最先进的性能。

translated by 谷歌翻译

Feature Alignment by Uncertainty and Self-Training for Source-Free Unsupervised Domain Adaptation

JoonHo Lee , Gyemin Lee

分类：计算机视觉 | 机器学习

2022-08-31

大多数无监督的域适应性（UDA）方法假设在模型适应过程中可用标记的源图像可用。但是，由于机密性问题或移动设备上的内存约束，这种假设通常是不可行的。为了解决这些问题，我们提出了一种简单但有效的无源UDA方法，该方法仅使用预训练的源模型和未标记的目标图像。我们的方法通过合并数据增强并以两个一致性目标训练功能生成器来捕获局部不确定性。鼓励功能生成器从头部分类器的决策边界学习一致的视觉功能。受到自我监督学习的启发，我们的方法促进了预测空间和特征空间之间的空间间比对，同时在特征空间内结合了空间的一致性，以减少源域和目标域之间的域间隙。我们还考虑了认知不确定性，以提高模型适应性能。对流行的UDA基准测试的广泛实验表明，我们的方法的性能是可比甚至优于香草UDA方法，而无需使用源图像或网络修改。

translated by 谷歌翻译

HTML版本

Prototypical Contrast Adaptation for Domain Adaptive Semantic Segmentation

Zhengkai Jiang , Yuxi Li , Ceyuan Yang , Peng Gao , Yabiao Wang , Ying Tai , Chengjie Wang

分类：计算机视觉

2022-07-14

无监督的域适应性（UDA）旨在使在标记的源域上训练的模型适应未标记的目标域。在本文中，我们提出了典型的对比度适应（PROCA），这是一种无监督域自适应语义分割的简单有效的对比度学习方法。以前的域适应方法仅考虑跨各个域的阶级内表示分布的对齐，而阶层间结构关系的探索不足，从而导致目标域上的对齐表示可能不像在源上歧视的那样容易歧视。域了。取而代之的是，ProCA将类间信息纳入班级原型，并采用以班级为中心的分布对齐进行适应。通过将同一类原型与阳性和其他类原型视为实现以集体为中心的分配对齐方式的负面原型，Proca在经典领域适应任务上实现了最先进的性能，{\ em i.e. text {and} synthia $ \ to $ cityScapes}。代码可在\ href {https://github.com/jiangzhengkai/proca} {proca}获得代码

translated by 谷歌翻译

Domain Attention Consistency for Multi-Source Domain Adaptation

Zhongying Deng , Kaiyang Zhou , Yongxin Yang , Tao Xiang

分类：计算机视觉

2021-11-06

大多数现有的多源域适配（MSDA）方法通过特征分布对准最小化多个源 - 目标域对之间的距离，从单个源设置借用的方法。但是，对于不同的源极域，对齐成对特征分布是具有挑战性的，甚至可以对MSDA进行反效率。在本文中，我们介绍了一种新颖的方法：可转让的属性学习。动机很简单：虽然不同的域可以具有急剧不同的视野，但它们包含相同的类类，其特征在一起相同的属性;因此，MSDA模型应该专注于学习目标域的最可转换的属性。采用这种方法，我们提出了域名关注一致性网络，称为DAC网。关键设计是一个特征通道注意模块，旨在识别可转移功能（属性）。重要的是，注意模块受到一致性损失的监督，这对源极和目标域之间的信道注意权重的分布施加。此外，为了促进对目标数据的鉴别特征学习，我们将伪标记与类紧凑性丢失相结合，以最小化目标特征和分类器的权重向量之间的距离。在三个MSDA基准测试中进行了广泛的实验表明，我们的DAC-NET在所有这些中实现了新的最新性能。

translated by 谷歌翻译

Adversarial Domain Adaptation with Prototype-Based Normalized Output Conditioner

Dapeng Hu , Jian Liang , Qibin Hou , Hanshu Yan , Yunpeng Chen

分类：计算机视觉

2020-03-30

在这项工作中，我们试图通过设计简单和紧凑的条件领域的逆势培训方法来解决无监督的域适应。我们首先重新审视简单的级联调节策略，其中特征与输出预测连接为鉴别器的输入。我们发现倾斜策略遭受了弱势调节力量。我们进一步证明扩大连接预测的规范可以有效地激励条件域对齐。因此，我们通过将输出预测标准化具有相同的特征的输出预测来改善连接调节，并且派生方法作为归一化输出调节器〜（名词）。然而，对域对齐的原始输出预测的调理，名词遭受目标域的不准确预测。为此，我们建议将原型空间中的跨域特征对齐方式而不是输出空间。将新的原型基于原型的调节与名词相结合，我们将增强方法作为基于原型的归一化输出调节器〜（代词）。对象识别和语义分割的实验表明，名词可以有效地对准域跨域的多模态结构，甚至优于最先进的域侵犯训练方法。与基于原型的调节一起，代词进一步提高了UDA的多个对象识别基准上的名词的适应性能。

translated by 谷歌翻译

Visual Prompt Tuning for Test-time Domain Adaptation

Yunhe Gao , Xingjian Shi , Yi Zhu , Hao Wang , Zhiqiang Tang , Xiong Zhou , Mu Li , Dimitris N. Metaxas

分类：计算机视觉

2022-10-10

Models should be able to adapt to unseen data during test-time to avoid performance drops caused by inevitable distribution shifts in real-world deployment scenarios. In this work, we tackle the practical yet challenging test-time adaptation (TTA) problem, where a model adapts to the target domain without accessing the source data. We propose a simple recipe called \textit{Data-efficient Prompt Tuning} (DePT) with two key ingredients. First, DePT plugs visual prompts into the vision Transformer and only tunes these source-initialized prompts during adaptation. We find such parameter-efficient finetuning can efficiently adapt the model representation to the target domain without overfitting to the noise in the learning objective. Second, DePT bootstraps the source representation to the target domain by memory bank-based online pseudo-labeling. A hierarchical self-supervised regularization specially designed for prompts is jointly optimized to alleviate error accumulation during self-training. With much fewer tunable parameters, DePT demonstrates not only state-of-the-art performance on major adaptation benchmarks VisDA-C, ImageNet-C, and DomainNet-126, but also superior data efficiency, i.e., adaptation with only 1\% or 10\% data without much performance degradation compared to 100\% data. In addition, DePT is also versatile to be extended to online or multi-source TTA settings.

translated by 谷歌翻译