Despite the impact of psychiatric disorders on clinical health, early-stage diagnosis remains a challenge. Machine learning studies have shown that classifiers tend to be overly narrow in the diagnosis prediction task. The overlap between conditions leads to high heterogeneity among participants that is not adequately captured by classification models. To address this issue, normative approaches have surged as an alternative method. By using a generative model to learn the distribution of healthy brain data patterns, we can identify the presence of pathologies as deviations or outliers from the distribution learned by the model. In particular, deep generative models showed great results as normative models to identify neurological lesions in the brain. However, unlike most neurological lesions, psychiatric disorders present subtle changes widespread in several brain regions, making these alterations challenging to identify. In this work, we evaluate the performance of transformer-based normative models to detect subtle brain changes expressed in adolescents and young adults. We trained our model on 3D MRI scans of neurotypical individuals (N=1,765). Then, we obtained the likelihood of neurotypical controls and psychiatric patients with early-stage schizophrenia from an independent dataset (N=93) from the Human Connectome Project. Using the predicted likelihood of the scans as a proxy for a normative score, we obtained an AUROC of 0.82 when assessing the difference between controls and individuals with early-stage schizophrenia. Our approach surpassed recent normative methods based on brain age and Gaussian Process, showing the promising use of deep generative models to help in individualised analyses.
translated by 谷歌翻译
深度神经网络在医学图像分析中带来了显着突破。但是,由于其渴望数据的性质,医学成像项目中适度的数据集大小可能会阻碍其全部潜力。生成合成数据提供了一种有希望的替代方案,可以补充培训数据集并进行更大范围的医学图像研究。最近,扩散模型通过产生逼真的合成图像引起了计算机视觉社区的注意。在这项研究中,我们使用潜在扩散模型探索从高分辨率3D脑图像中生成合成图像。我们使用来自英国生物银行数据集的T1W MRI图像(n = 31,740)来训练我们的模型,以了解脑图像的概率分布,该脑图像以协变量为基础,例如年龄,性别和大脑结构量。我们发现我们的模型创建了现实的数据,并且可以使用条件变量有效地控制数据生成。除此之外,我们创建了一个带有100,000次脑图像的合成数据集,并使科学界公开使用。
translated by 谷歌翻译
深层生成模型已成为检测数据中任意异常的有前途的工具,并分配了手动标记的必要性。最近,自回旋变压器在医学成像中取得了最先进的性能。但是,这些模型仍然具有一些内在的弱点,例如需要将图像建模为1D序列,在采样过程中误差的积累以及与变压器相关的显着推理时间。去核扩散概率模型是一类非自动回旋生成模型,最近显示出可以在计算机视觉中产生出色的样品(超过生成的对抗网络),并实现与变压器具有竞争力同时具有快速推理时间的对数可能性。扩散模型可以应用于自动编码器学到的潜在表示,使其易于扩展,并适用于高维数据(例如医学图像)的出色候选者。在这里,我们提出了一种基于扩散模型的方法,以检测和分段脑成像中的异常。通过在健康数据上训练模型,然后探索其在马尔可夫链上的扩散和反向步骤,我们可以识别潜在空间中的异常区域,因此可以确定像素空间中的异常情况。我们的扩散模型与一系列具有2D CT和MRI数据的实验相比,具有竞争性能,涉及合成和实际病理病变,推理时间大大减少,从而使它们的用法在临床上可行。
translated by 谷歌翻译
人类机器人相互作用(HRI)对于在日常生活中广泛使用机器人至关重要。机器人最终将能够通过有效的社会互动来履行人类文明的各种职责。创建直接且易于理解的界面,以与机器人开始在个人工作区中扩散时与机器人互动至关重要。通常,与模拟机器人的交互显示在屏幕上。虚拟现实(VR)是一个更具吸引力的替代方法,它为视觉提示提供了更像现实世界中看到的线索。在这项研究中,我们介绍了Jubileo,这是一种机器人的动画面孔,并使用人类机器人社会互动领域的各种研究和应用开发工具。Jubileo Project不仅提供功能齐全的开源物理机器人。它还提供了一个全面的框架,可以通过VR接口进行操作,从而为HRI应用程序测试带来沉浸式环境,并明显更好地部署速度。
translated by 谷歌翻译
使用机器学习算法从未标记的文本中提取知识可能很复杂。文档分类和信息检索是两个应用程序,可以从无监督的学习(例如文本聚类和主题建模)中受益,包括探索性数据分析。但是,无监督的学习范式提出了可重复性问题。初始化可能会导致可变性,具体取决于机器学习算法。此外,关于群集几何形状,扭曲可能会产生误导。在原因中,异常值和异常的存在可能是决定因素。尽管初始化和异常问题与文本群集和主题建模相关,但作者并未找到对它们的深入分析。这项调查提供了这些亚地区的系统文献综述(2011-2022),并提出了共同的术语,因为类似的程序具有不同的术语。作者描述了研究机会,趋势和开放问题。附录总结了与审查的作品直接或间接相关的文本矢量化,分解和聚类算法的理论背景。
translated by 谷歌翻译
癌症是一种复杂的疾病,具有重大的社会和经济影响。高通量分子测定的进步以及进行高质量多摩斯测量的成本降低,通过机器学习促进了见解。先前的研究表明,使用多个OMIC预测生存和分层癌症患者的希望。在本文中,我们开发了一种有监督的自动编码器(SAE)模型,用于基于生存的多摩变集成,该模型在以前的工作中改进,并报告一种具体的监督自动编码器模型(CSAE),该模型(CSAE)也使用功能选择来共同重建输入功能。作为预测生存。我们的实验表明,我们的模型表现优于或与一些最常用的基线相提并论,同时提供更好的生存分离(SAE)或更容易解释(CSAE)。我们还对我们的模型进行了特征选择稳定性分析,并注意到与通常与生存有关的特征存在幂律关系。该项目的代码可在以下网址获得:https://github.com/phcavelar/coxae
translated by 谷歌翻译
MultiSets是传统的集合概念的直观扩展,允许重复元素,每个元素的次数看起来​​被理解为相应的多重性。最近的多项数据概括为实际值函数,考虑可能负值,已经为许多有趣的影响和应用程序铺平了道路,包括作为电子系统的各自实现。基本的多立方操作包括集合互补(符号更改),交叉路口(两个值之间的最小值),Union(两个值之间的最大值),差异和总和(与代数对应相同)。当应用于功能或信号时,还需要符号和联合符号功能。鉴于信号是功能,可以有效地将多功能和多功能操作转换为模拟电子设备,这是本工作的目的。建议可以在离散或集成电路中相对简单地获得能够获得高性能自我和互相关的有效的多立方操作。还简要讨论了开关噪声的问题。目前的结果具有模拟和数字电子产品的应用和相关开发的潜力,以及模式识别,信号处理和深度学习。
translated by 谷歌翻译
目前的工作发展了最近引入的实质jaccard和巧合指数和相应的功能的人工神经元的比较表现。我们的研究中也包括在线指数和经典的互相关。在介绍与多项商和采用的相似度相关的基本概念之后,包括关于较高订单的实际jaccard和西班牙人指数的概述的新结果,我们继续研究单个神经元的响应,而不是考虑到输出非线性(例如〜s形),分别在存在位移,放大,强度变化,噪声和来自附加模式的干扰的情况下检测高斯刺激。结果表明,实验性的Jaccard和巧合方法比内部指数和经典的互相关是更强大的鲁棒性和有效性。基于巧合的神经元显示为所考虑的数据和扰动的最佳整体性能。报告的概念,方法和结果,不仅具有实质性的影响,不仅用于糕点识别和深度学习,而且还具有神经生物学和神经科学的影响。
translated by 谷歌翻译
除了概念和计算简单之外,还经过验证的实际jaccard和巧合指数还经过验证,能够提供有希望的诸如模板匹配的任务,趋于产生比通常由标准获得的峰值更清晰和更窄的峰值互相关,同时还衰减基本上二次匹配。在这项工作中,从模板匹配的角度比较了基于真实的MultiSet Jaccard和巧合指数的基于多网的相关性,这是一般对模式识别,深度学习和科学建模的令人鼓舞的结果。基于多网的相关方法,尤其是重合指标,呈现出较小的表现,其特征在于更清晰和较窄的峰,而次级峰值衰减,即使存在强烈的噪声水平也是保持的。特别地,从重合指标衍生的两种方法导致了特别有趣的结果。然而,交叉相关呈现对对称添加剂噪声的最佳稳健性,这提出了所考虑方法的新组合。在初步研究多网方法的相对性能之后,以及经典的互相关之后,提出了一种系统的比较框架,并应用了上述方法的研究。报告了几种结果,包括确认,至少对于所考虑的数据类型,重合相关性,因为在缩小尖峰峰的检测中提供增强的性能,而二次匹配适当衰减。组合方法也导致在存在强烈的添加剂噪声存在下处理信号。
translated by 谷歌翻译
相似的两个数学结构之间的客观量化构成了科学和技术反复的问题。在目前的工作中,我们开发了一种有原则的办法,把克罗内克的δ函数两个标量值作为用于相似度量化原型引用,然后推导出更高产索引,其中的三个结合推广这些指数的0和1之间取考虑到标量值的符号然后提出并发展到多集,向量,并在现实的空间功能。一些重要的成果已经获得,包括杰卡德指数克罗内克的δ函数的产生是解释执行的。当推广到实函数,四个描述相似性指数成为各自函,然后可将其用于获得卷积和相关的相关联的操作。
translated by 谷歌翻译