智能论文笔记

Ranking-Enhanced Unsupervised Sentence Representation Learning

Yeon Seonwoo , Guoyin Wang , Sajal Choudhary , Changmin Seo , Jiwei Li , Xiang Li , Puyang Xu , Sunghyun Park , Alice Oh

分类：自然语言处理

2022-09-09

以前的无监督句子嵌入研究集中在数据增强方法上，例如辍学和基于规则的句子转换方法。但是，这些方法限制了控制句子增强观点的细粒语义。这导致监督信号不足以捕获类似句子的语义相似性。在这项工作中，我们发现使用邻居句子可以捕获相似句子之间更准确的语义相似性。基于这一发现，我们提出了RankEncoder，该发现使用了输入句子和语料库中的句子之间的关系来训练无监督的句子编码器。我们从三个角度评估rankencoder：1）语义文本相似性性能，2）相似句子对的功效，以及3）rankencoder的普遍性。实验结果表明，与先前的最新性能相比，Rankencoder达到80.07 \％Spearman的相关性，绝对提高了1.1％。在类似的句子对上，改进更加显着，改善了1.73％。另外，我们证明了RankEncoder普遍适用于现有的无监督句子编码器。

translated by 谷歌翻译

Object Goal Navigation with End-to-End Self-Supervision

So Yeon Min , Yao-Hung Hubert Tsai , Wei Ding , Ali Farhadi , Ruslan Salakhutdinov , Yonatan Bisk , Jian Zhang

分类：机器人 | 机器学习

2022-12-09

A household robot should be able to navigate to target locations without requiring users to first annotate everything in their home. Current approaches to this object navigation challenge do not test on real robots and rely on expensive semantically labeled 3D meshes. In this work, our aim is an agent that builds self-supervised models of the world via exploration, the same as a child might. We propose an end-to-end self-supervised embodied agent that leverages exploration to train a semantic segmentation model of 3D objects, and uses those representations to learn an object navigation policy purely from self-labeled 3D meshes. The key insight is that embodied agents can leverage location consistency as a supervision signal - collecting images from different views/angles and applying contrastive learning to fine-tune a semantic segmentation model. In our experiments, we observe that our framework performs better than other self-supervised baselines and competitively with supervised baselines, in both simulation and when deployed in real houses.

translated by 谷歌翻译

Enhanced artificial intelligence-based diagnosis using CBCT with internal denoising: Clinical validation for discrimination of fungal ball, sinusitis, and normal cases in the maxillary sinus

Kyungsu Kim , Chae Yeon Lim , Joong Bo Shin , Myung Jin Chung , Yong Gi Jung

分类：计算机视觉

2022-11-29

The cone-beam computed tomography (CBCT) provides 3D volumetric imaging of a target with low radiation dose and cost compared with conventional computed tomography, and it is widely used in the detection of paranasal sinus disease. However, it lacks the sensitivity to detect soft tissue lesions owing to reconstruction constraints. Consequently, only physicians with expertise in CBCT reading can distinguish between inherent artifacts or noise and diseases, restricting the use of this imaging modality. The development of artificial intelligence (AI)-based computer-aided diagnosis methods for CBCT to overcome the shortage of experienced physicians has attracted substantial attention. However, advanced AI-based diagnosis addressing intrinsic noise in CBCT has not been devised, discouraging the practical use of AI solutions for CBCT. To address this issue, we propose an AI-based computer-aided diagnosis method using CBCT with a denoising module. This module is implemented before diagnosis to reconstruct the internal ground-truth full-dose scan corresponding to an input CBCT image and thereby improve the diagnostic performance. The external validation results for the unified diagnosis of sinus fungal ball, chronic rhinosinusitis, and normal cases show that the proposed method improves the micro-, macro-average AUC, and accuracy by 7.4, 5.6, and 9.6% (from 86.2, 87.0, and 73.4 to 93.6, 92.6, and 83.0%), respectively, compared with a baseline while improving human diagnosis accuracy by 11% (from 71.7 to 83.0%), demonstrating technical differentiation and clinical effectiveness. This pioneering study on AI-based diagnosis using CBCT indicates denoising can improve diagnostic performance and reader interpretability in images from the sinonasal area, thereby providing a new approach and direction to radiographic image reconstruction regarding the development of AI-based diagnostic solutions.

translated by 谷歌翻译

Data Leaves: Scenario-oriented Metadata for Data Federative Innovation

Yukio Ohsawa , Kaira Sekiguchi , Tomohide Maekawa , Hiroki Yamaguchi , Son Yeon Hyuk , Sae Kondo

分类：人工智能

2022-08-07

提出了一种表示每个数据集的消化信息的方法，以创新思想的帮助以及试图使用或组合数据集创建有价值的产品，服务和业务模型的数据用户的通信。与通过共享属性（即变量）连接数据集的方法相比，此方法通过在现实世界中应活跃的情况下通过事件，情况或操作连接数据集。该方法反映了每个元数据对特征概念的适应性的考虑，这是预期从数据中获得的信息或知识的摘要；因此，数据的用户获得了适合真实企业和现实生活需求的实践知识，以及将AI技术应用于数据的基础。

translated by 谷歌翻译

Improving Small Lesion Segmentation in CT Scans using Intensity Distribution Supervision: Application to Small Bowel Carcinoid Tumor

Seung Yeon Shin , Thomas C. Shen , Stephen A. Wank , Ronald M. Summers

分类：计算机视觉

2022-07-29

由于缺乏明显的特征，严重的阶级失衡以及大小本身，找到小病变非常具有挑战性。改善小病变细分的一种方法是减少感兴趣的区域，并以更高的灵敏度进行检查，而不是为整个区域执行它。通常将其作为器官和病变的顺序或关节分割实现，这需要对器官分割进行额外的监督。取而代之的是，我们建议以无其他标记成本的强度分布来有效地分开病变位于背景的区域。它被整合到网络培训中，作为一项辅助任务。我们将提出的方法应用于CT扫描中小肠癌小肿瘤的分割。我们观察到所有指标的改进（33.5％$ \ rightarrow $ 38.2％，41.3％$ \ rightarrow $ 47.8％，30.0％$ \ rightarrow $ \ rightarrow $ 35.9％的全球，每个案例和每个肿瘤骰子得分相比）。对于基线方法，这证明了我们想法的有效性。我们的方法可以是将目标的强度分布信息显式合并到网络培训中的一种选择。

translated by 谷歌翻译

Graph-Based Small Bowel Path Tracking with Cylindrical Constraints

Seung Yeon Shin , Sungwon Lee , Ronald M. Summers

分类：计算机视觉

2022-07-29

我们提出了一种基于圆柱约束的小肠路径跟踪的新的基于图的方法。与其他器官相比，小肠的独特特征是自身沿其路线之间的接触，这使得路径跟踪与墙壁的模糊外观一起困难。它会导致轨道路径在依靠墙壁检测（例如墙壁检测）之类的低级特征时轻松越过墙壁。为了解决这个问题，使用小肠过程中安装的一系列气缸用于指导跟踪到更可靠的方向。它使用新的成本函数作为软约束实现。对所提出的方法进行了针对小肠从小到末端进行10次腹部CT扫描的基础真相路径的评估。与基线方法相比，所提出的方法在跟踪路径而没有犯错的情况下显示出明显的改进。对于与小肠分割有关的两种不同的设置，观察到了6.6％和17.0％的改善。

translated by 谷歌翻译

Extraction of Coronary Vessels in Fluoroscopic X-Ray Sequences Using Vessel Correspondence Optimization

Seung Yeon Shin , Soochahn Lee , Kyoung Jin Noh , Il Dong Yun , Kyoung Mu Lee

分类：计算机视觉

2022-07-28

我们提出了一种从荧光X射线序列中提取冠状动脉血管的方法。给定源框架的血管结构，随后框架中的血管对应候选者是由新型的分层搜索方案生成的，以克服孔径问题。最佳对应关系是在马尔可夫随机字段优化框架内确定的。由于对比剂的流入，进行后处理以提取新近可见的血管分支。在18个序列的数据集上进行的定量和定性评估证明了该方法的有效性。

translated by 谷歌翻译

Comparative Validation of AI and non-AI Methods in MRI Volumetry to Diagnose Parkinsonian Syndromes

Joomee Song , Juyoung Hahm , Jisoo Lee , Chae Yeon Lim , Myung Jin Chung , Jinyoung Youn , Jin Whan Cho , Jong Hyeon Ahn , Kyung-Su Kim

分类：人工智能

2022-07-23

大脑磁共振成像（MRI）扫描的自动分割和体积对于诊断帕金森氏病（PD）和帕金森氏症综合症（P-Plus）至关重要。为了提高诊断性能，我们在大脑分割中采用了深度学习（DL）模型，并将其性能与金标准的非DL方法进行了比较。我们收集了健康对照组（n = 105）和PD患者（n = 105），多个全身性萎缩（n = 132）和渐进性超核麻痹（n = 69）的大脑MRI扫描。 2020.使用金标准的非DL模型FreeSurfer（FS），我们对六个脑结构进行了分割：中脑，PON，CAUDATE，CAUDATE，PUTATATE，pALLIDUM和THIRD CNTRICLE，并将其视为DL模型的注释数据，代表性V -net和unet。计算了分化正常，PD和P-Plus病例的曲线下的骰子分数和面积。每位患者六个大脑结构的V-NET和UNETR的分割时间分别为3.48 +-0.17和48.14 +-0.97 s，比FS（15,735 +-1.07 s）快至少300倍。两种DL模型的骰子得分都足够高（> 0.85），它们的疾病分类AUC优于FS。为了分类正常与P-Plus和PD与多个全身性萎缩（小脑型）的分类，DL模型和FS显示出高于0.8的AUC。 DL显着减少了分析时间，而不会损害大脑分割和差异诊断的性能。我们的发现可能有助于在临床环境中采用DL脑MRI分割并提高大脑研究。

translated by 谷歌翻译

Grounding Visual Representations with Texts for Domain Generalization

Seonwoo Min , Nokyung Park , Siwon Kim , Seunghyun Park , Jinkyu Kim

分类：计算机视觉 | 自然语言处理 | 机器学习

2022-07-21

减少源和目标域之间的表示形式差异是最大化模型概括的关键组件。在这项工作中，我们倡导利用自然语言监督域的概括任务。我们将两个模块介绍给地面视觉表示，其中包含人类典型推理的文本：（1）视觉和文本关节嵌入器以及（2）文本解释发生器。前者学习图像文本的关节嵌入空间，我们可以将高级类别歧视性信息接地到模型中。后者利用了一个可解释的模型，并生成了解释，证明其决定背后的理由是合理的。据我们所知，这是为域泛化任务利用视觉和语言跨模式方法的第一项工作。我们使用新创建的CUB-DG基准数据集进行的实验表明，可以成功地将跨模式监督用于接地域不变的视觉表示并改善模型的概括。此外，在大规模域基准测试中，我们提出的方法可实现最先进的结果，并在五个多域数据集的平均性能中排名第一。数据集和代码可在https://github.com/mswzeus/gvrt上找到。

translated by 谷歌翻译

Pure Transformers are Powerful Graph Learners

Jinwoo Kim , Tien Dat Nguyen , Seonwoo Min , Sungjun Cho , Moontae Lee , Honglak Lee , Seunghoon Hong

分类：机器学习 | 人工智能

2022-07-06

我们表明，没有图形特异性修改的标准变压器可以在理论和实践中都带来图形学习的有希望的结果。鉴于图，我们只是将所有节点和边缘视为独立的令牌，用令牌嵌入增强它们，然后将它们馈入变压器。有了适当的令牌嵌入选择，我们证明这种方法在理论上至少与不变的图形网络（2-ign）一样表达，由等效线性层组成，它已经比所有消息传播的图形神经网络（GNN）更具表现力）。当在大规模图数据集（PCQM4MV2）上接受训练时，与具有精致的图形特异性电感偏置相比，与GNN基准相比，与GNN基准相比，与GNN基准相比，与GNN基准相比，我们创造的令牌化图形变压器（Tokengt）取得了明显更好的结果。我们的实施可从https://github.com/jw9730/tokengt获得。

translated by 谷歌翻译