智能论文笔记

Supervised Contrastive Learning with Hard Negative Samples

Ruijie Jiang , Thuan Nguyen , Prakash Ishwar , Shuchin Aeron

分类：机器学习

2022-08-31

无监督的对比度学习（UCL）是一种自我监督的学习技术，旨在通过将正面样本彼此接近，同时将负面样本推到嵌入空间中远处，以学习有用的表示功能。为了提高UCL的性能，几项作品引入了旨在选择“硬”阴性样本与UCL中使用的随机采样策略相比，旨在选择“硬”阴性样本的硬性阴性对比度学习（H-UCL）。在另一种方法中，在假设标签信息可用的假设下，有监督的对比学习（SCL）最近通过将UCL扩展到完全监督的环境来开发。在本文中，由于硬性采样策略在H-UCL中的有效性以及标签信息在SCL中的有用性的启发性，我们提出了一个称为硬性负责监督的对比度学习（H-SCL）的对比学习框架。我们的数值结果证明了H-SCL在几个图像数据集上对SCL和H-UCL的有效性。另外，从理论上讲，在某些条件下，H-SCL的目标函数可以受H-UCL的目标函数的界定，而不是由UCL的目标函数界定。因此，将H-UCL损失最小化可以作为最小化H-SCL损失的代理，而最小化UCL损失不能。正如我们数值表明H-SCL优于其他对比学习方法时，我们的理论结果（通过H-UCL损失界限H-SCL损失）有助于解释为什么H-UCL在实践中优于UCL。

translated by 谷歌翻译

Joint covariate-alignment and concept-alignment: a framework for domain generalization

Thuan Nguyen , Boyang Lyu , Prakash Ishwar , Matthias Scheutz , Shuchin Aeron

分类：机器学习 | 人工智能 | 计算机视觉

2022-08-01

在本文中，我们提出了一个新的领域概括（DG）框架，基于与看不见领域的风险的新上限。尤其是，我们的框架建议共同最大程度地减少可见域之间的协变量转移以及概念转移，从而在看不见的域上表现更好。虽然可以通过协变量和概念对准模块的任意组合来实施所提出的方法，但在这项工作中，我们使用良好的方法来分配一致性，即最大平均差异（MMD）和协方差比对（珊瑚）和使用，并使用不变的风险最小化（IRM）基于概念对齐的方法。我们的数值结果表明，所提出的方法在几个数据集上的域概括性要比最先进的方法执行或更好。

translated by 谷歌翻译

Measure Estimation in the Barycentric Coding Model

Matthew Werenski , Ruijie Jiang , Abiy Tasissa , Shuchin Aeron , James M. Murphy

分类： (统计)机器学习 | 机器学习

2022-01-28

本文考虑了Barycentric编码模型（BCM）下的测量估计问题，其中假定未知的度量属于有限的已知测量集的Wasserstein-2 Barycenters集合。估计该模型下的度量等同于估计未知的Barycentric坐标。我们为BCM下的测量估计提供了新颖的几何，统计和计算见解，由三个主要结果组成。我们的第一个主要结果利用了Wasserstein-2空间的Riemannian几何形状，以提供恢复Barycentric坐标的程序，作为假设对真实参考度量访问的二次优化问题的解决方案。基本的几何见解是，该二次问题的参数是由从给定度量到定义BCM的参考度量的最佳位移图之间的内部产物确定的。然后，我们的第二个主要结果建立了一种算法，用于求解BCM中坐标的算法，当时通过I.I.D进行经验观察到所有测量。样品。我们证明了该算法的精确收敛速率 - 取决于基本措施的平稳性及其维度 - 从而保证其统计一致性。最后，我们证明了BCM和相关估计程序在三个应用领域的实用性：（i）高斯措施的协方差估计；（ii）图像处理；（iii）自然语言处理。

translated by 谷歌翻译

Conditional entropy minimization principle for learning domain invariant representation features

Thuan Nguyen , Boyang Lyu , Prakash Ishwar , Matthias Scheutz , Shuchin Aeron

分类：机器学习 | 人工智能

2022-01-25

基于不变性的方法，例如不变风险最小化（IRM），最近已成为有前途的域泛化方法（DG）。尽管有希望的理论，但由于真正不变特征和虚假不变特征的混合，这种方法在共同的分类任务中失败。为了解决这个问题，我们提出了一个基于条件熵最小化（CEM）原理的框架，以滤除带有具有更好概括能力的新算法的虚假不变特征。我们表明，我们提出的方法与众所周知的信息瓶颈（IB）框架密切相关，并证明在某些假设下，熵最小化可以准确恢复真正的不变特征。与最近在几个DG数据集中的最新原理替代方案相比，我们的方法提供了竞争性的分类精度。

translated by 谷歌翻译

Hard Negative Sampling via Regularized Optimal Transport for Contrastive Representation Learning

Ruijie Jiang , Prakash Ishwar , Shuchin Aeron

分类：机器学习

2021-11-04

我们研究了针对无监督对比代表学习的硬消耗采样分布设计的问题。我们分析了一种新的MIN-MAX框架，寻求一种表示最小化所有联轴器的最大（最差情况）的广义对比学习损失（正面和阴性样本之间的关节分布）并证明所得的最小最大值代表性将是堕落的。这提供了在联轴器上结合额外的正则化约束的第一理论典范。我们通过最佳运输理论的镜头重新解释最小最大问题，并利用正则化的传输联轴来控制负例的硬度。我们证明最近提出的最先进的硬负面采样分布是对应于耦合熵正则化的特殊情况。

translated by 谷歌翻译

Interpretable contrastive word mover's embedding

Ruijie Jiang , Julia Gouvea , Eric Miller , David Hammer , Shuchin Aeron

分类：自然语言处理 | 机器学习

2021-11-01

本文通过添加解释性，可以显着提高对分类文件的监督嵌入的流行方法，即对比词媒体嵌入。通过将聚类促进机制结合到对比损失来实现这种可解释性。在几个公共数据集上，我们表明我们的方法在现有的基座上显着提高，同时通过识别一组关键字来解释群集，这些关键字是特定类的最具代表性的。我们的方法是有必要开发\ Texit的自然语言处理（NLP）方法{评估科学写作和思维的学生工作的新问题} - 这是一个（教育）学习科学领域的核心问题（LS）。在这种情况下，我们表明我们的方法会导致对来自生物阶层的实验室报告有意义的学生工作的有意义评估，并可以帮助LS研究人员进入学生理解和评估科学思想过程的证据。

translated by 谷歌翻译

Automated Pruning of Polyculture Plants

Mark Presten , Rishi Parikh , Shrey Aeron , Sandeep Mukherjee , Simeon Adebola , Satvik Sharma , Mark Theis , Walter Teitelbaum , Ken Goldberg

分类：机器人 | 人工智能

2022-08-22

多养殖养殖具有环境优势，但比单一养殖需要更修剪。我们介绍用于自动修剪的新型硬件和算法。自主系统使用高架摄像头从物理规模的花园测试床中收集数据，利用学识渊博的植物表型卷积神经网络和边界磁盘跟踪算法来评估单个植物分布并每天估算花园的状态。从这个花园状态下，Alphagardensim选择植物自主修剪。训练有素的神经网络检测并靶向工厂上的特定修发点。实验评估了两种与农业机器人龙门系统兼容的定制设计的修剪工具，并通过受控算法进行了自主削减。我们提出了四个60天的花园周期的结果。结果表明，该系统可以自主实现0.94个归一化的植物多样性，并在修剪剪切的同时保持平均冠层覆盖率为0.84，到周期结束时。有关代码，视频和数据集，请参见https：//sites.google.com/berkeley.edu/pruningpolyculture。

translated by 谷歌翻译

AlphaGarden: Learning to Autonomously Tend a Polyculture Garden

Mark Presten , Yahav Avigal , Mark Theis , Satvik Sharma , Rishi Parikh , Shrey Aeron , Sandeep Mukherjee , Sebastian Oehme , Simeon Adebola , Walter Teitelbaum

分类：机器人 | 人工智能

2021-11-11

本文展示了alphaRARDEN：一个自治的多种植花园，在1.5米×3.0米的物理测试平台中撒上和灌溉生物植物。alphanArden使用架空相机和传感器来跟踪植物分布和土壤水分。我们模拟个体植物生长和平面动态，以培训选择行动以最大化叶片覆盖和多样性的政策。对于自主修剪，alphanarden使用两个定制的修剪工具和训练有素的神经网络来检测紫杉角。我们为四个60天的花园周期提供了结果。结果表明，alphaRARARDEN可以自主地实现0.96个归一化多样性，在循环峰值期间保持0.86的平均冠层覆盖率。可以在https://github.com/berkeleyautomation/alpharden找到代码，数据集和补充材料。

translated by 谷歌翻译