更多数据有助于我们推广到任务。但是实际数据集可以包含分布(OOD)数据;这可以以异质性的形式出现,例如类内变异性,也可以以时间变化或概念漂移的形式出现。我们在此类问题上展示了一种反直觉现象:任务的概括误差可能是OOD样本数量的非单调函数;少数OOD样品可以改善概括,但是如果OOD样品的数量超出了阈值,则概括误差可能会恶化。我们还表明,如果我们知道哪些样品是OOD,则使用目标和OOD样品之间的加权目标确保概括误差单调减少。我们使用线性分类器在CIFAR-10上的合成数据集和中型神经网络上使用线性分类器演示和分析了此问题。
translated by 谷歌翻译
This paper introduces the Forgotten Realms Wiki (FRW) data set and domain specific natural language generation using FRW along with related analyses. Forgotten Realms is the de-facto default setting of the popular open ended tabletop fantasy role playing game, Dungeons & Dragons. The data set was extracted from the Forgotten Realms Fandom wiki consisting of more than over 45,200 articles. The FRW data set is constituted of 11 sub-data sets in a number of formats: raw plain text, plain text annotated by article title, directed link graphs, wiki info-boxes annotated by the wiki article title, Poincar\'e embedding of first link graph, multiple Word2Vec and Doc2Vec models of the corpus. This is the first data set of this size for the Dungeons & Dragons domain. We then present a pairwise similarity comparison benchmark which utilizes similarity measures. In addition, we perform D&D domain specific natural language generation using the corpus and evaluate the named entity classification with respect to the lore of Forgotten Realms.
translated by 谷歌翻译
State-of-the-art brain tumor segmentation is based on deep learning models applied to multi-modal MRIs. Currently, these models are trained on images after a preprocessing stage that involves registration, interpolation, brain extraction (BE, also known as skull-stripping) and manual correction by an expert. However, for clinical practice, this last step is tedious and time-consuming and, therefore, not always feasible, resulting in skull-stripping faults that can negatively impact the tumor segmentation quality. Still, the extent of this impact has never been measured for any of the many different BE methods available. In this work, we propose an automatic brain tumor segmentation pipeline and evaluate its performance with multiple BE methods. Our experiments show that the choice of a BE method can compromise up to 15.7% of the tumor segmentation performance. Moreover, we propose training and testing tumor segmentation models on non-skull-stripped images, effectively discarding the BE step from the pipeline. Our results show that this approach leads to a competitive performance at a fraction of the time. We conclude that, in contrast to the current paradigm, training tumor segmentation models on non-skull-stripped images can be the best option when high performance in clinical practice is desired.
translated by 谷歌翻译
在现实世界中存在的各种田间条件下,通常会挑战准确的作物行检测。传统的基于颜色的细分无法满足所有此类变化。在农业环境中缺乏全面的数据集限制了研究人员开发强大的分割模型来检测作物行。我们提出了一个用于作物行检测的数据集,其中有11种与甜菜和玉米作物的田间变化。我们还提出了一种新型的作物行检测算法,用于在作物行场中进行视觉伺服。我们的算法可以在不同的田间条件下检测作物行,例如弯曲的作物行,杂草的存在,不连续性,生长阶段,具无金,阴影和光水平。我们的方法仅使用来自沙哑的机器人上正式摄像头的RGB图像来预测作物行。我们的方法表现优于经典的基于颜色的作物行检测基线。在农作物行检测算法的最具挑战性的田间条件下,杂草之间存在茂密的杂草,而作物行中的不连续性是最具挑战性的田间条件。我们的方法可以检测到作物行的末端,并在到达农作物行的末端时将机器人驶向岬角区域。
translated by 谷歌翻译
农业环境中的自主导航通常受到可能在耕地中可能出现的不同田间条件的挑战。在这些农业环境中自动导航的最新解决方案将需要昂贵的硬件,例如RTK-GPS。本文提出了一种强大的作物排检测算法,该算法可以承受这些变化,同时检测作物行进行视觉伺服。创建了一个糖图像的数据集,其中有43个组合在可耕地中发现的11个田间变化。新型的作物行检测算法既经过作物行检测性能,又要测试沿农作系的视觉伺服伺服的能力。该算法仅使用RGB图像作为输入,并且使用卷积神经网络来预测作物行面罩。我们的算法优于基线方法,该方法使用基于颜色的分割来实现场变化的所有组合。我们使用一个组合性能指标,该指标解释了作物行检测的角度和位移误差。我们的算法在作物的早期生长阶段表现出最差的表现。
translated by 谷歌翻译
ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列,该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战,这是由于探测器的几何形状,不均匀的散射和冰中光的吸收,并且低于100 GEV的光,每个事件产生的信号光子数量相对较少。为了应对这一挑战,可以将ICECUBE事件表示为点云图形,并将图形神经网络(GNN)作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开,对不同的中微子事件类型进行分类,并重建沉积的能量,方向和相互作用顶点。基于仿真,我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术,包括已知系统不确定性的影响。对于中微子事件分类,与当前的IceCube方法相比,GNN以固定的假阳性速率(FPR)提高了信号效率的18%。另外,GNN在固定信号效率下将FPR的降低超过8(低于半百分比)。对于能源,方向和相互作用顶点的重建,与当前最大似然技术相比,分辨率平均提高了13%-20%。当在GPU上运行时,GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件,这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。
translated by 谷歌翻译
预测周围动态剂的未来轨迹是自动驾驶中的必要要求。这些轨迹主要取决于周围的静态环境以及这些动态剂的过去运动。此外,代理意图的多模式性质使轨迹预测问题更具挑战性。所有现有模型都同样考虑目标剂以及周围的剂,而无需考虑物理特性的变化。在本文中,我们为自动驾驶中的多模式轨迹预测提供了一个新颖的基于深度学习的框架,该框架考虑了目标及周围车辆的物理特性,例如对象类及其物理尺寸通过加权注意模块,从而改善预测的准确性。我们的模型在Nuscenes轨迹预测基准测试中取得了最高的结果,这些模型是使用栅格图来输入环境信息的模型。此外,我们的模型能够实时运行,达到300 fps的高推理率。
translated by 谷歌翻译
准确的睡眠阶段分类对于睡眠健康评估很重要。近年来,已经开发了几种基于深度学习和机器学习的睡眠阶段算法,并且在人类注释方面取得了表现。尽管性能提高,但最深入学习算法的局限性是其黑盒行为,它限制了它们在临床环境中的使用。在这里,我们提出了跨模式变压器,这是一种基于变压器的睡眠阶段分类的方法。我们的模型通过最先进的方法实现了竞争性能,并通过利用注意模块的可解释性方面消除了深度学习模型的黑盒行为。提出的跨模式变压器由一种新型的跨模式变压器编码器结构以及多尺度的一维卷积神经网络组成,用于自动表示学习。基于此设计的我们的睡眠阶段分类器能够以与最先进的方法相同或更好地达到睡眠阶段分类性能,以及可解释性,参数数量减少了四倍,并且比较培训时间减少了。到当前的最新。我们的代码可从https://github.com/jathurshan0330/cross-modal-transformer获得。
translated by 谷歌翻译
点云过滤和正常估计是3D场中的两个基本研究问题。现有方法通常会单独执行正常的估计和过滤,并且经常表现出对噪声和/或无法保留尖锐几何特征(例如角和边缘)的敏感性。在本文中,我们提出了一种新颖的深度学习方法,以共同估计正态和过滤点云。我们首先引入了一个基于3D补丁的对比学习框架,并以噪声损坏为增强,以训练能够生成点云斑块的忠实表示的功能编码器,同时保持噪音的强大功能。这些表示由简单的回归网络消耗,并通过新的关节损失进行监督,同时估算用于过滤贴片中心的点正常和位移。实验结果表明,我们的方法同时支持这两个任务,并保留尖锐的功能和细节。通常,它在这两个任务上都胜过最先进的技术。
translated by 谷歌翻译
使用机器学习算法从未标记的文本中提取知识可能很复杂。文档分类和信息检索是两个应用程序,可以从无监督的学习(例如文本聚类和主题建模)中受益,包括探索性数据分析。但是,无监督的学习范式提出了可重复性问题。初始化可能会导致可变性,具体取决于机器学习算法。此外,关于群集几何形状,扭曲可能会产生误导。在原因中,异常值和异常的存在可能是决定因素。尽管初始化和异常问题与文本群集和主题建模相关,但作者并未找到对它们的深入分析。这项调查提供了这些亚地区的系统文献综述(2011-2022),并提出了共同的术语,因为类似的程序具有不同的术语。作者描述了研究机会,趋势和开放问题。附录总结了与审查的作品直接或间接相关的文本矢量化,分解和聚类算法的理论背景。
translated by 谷歌翻译