智能论文笔记

MULTIPAR: Supervised Irregular Tensor Factorization with Multi-task Learning

Yifei Ren , Jian Lou , Li Xiong , Joyce C Ho , Xiaoqian Jiang , Sivasubramanium Bhavan

分类：机器学习

2022-08-01

张量分解因其在多维数据中捕获潜在因素的固有能力而获得了越来越多的兴趣，该数据具有许多应用程序，例如推荐系统和电子健康记录（EHR）挖掘。已经提出了Parafac2及其变体来解决不规则的张量，其中一种张量模式不对齐，例如，EHR中推荐系统或患者的不同用户可能具有不同的记录。 PARAFAC2已成功应用于EHRS，用于提取有意义的医学概念（表型）。尽管有最近的进步，但当前模型的可预测性和可解释性并不令人满意，这限制了其用于下游分析的效用。在本文中，我们提出了多个多任务学习的多个监督不规则张量分解。多个多个可以灵活地包含静态（例如，院内死亡率预测）和连续或动态（例如，通风的需求）任务。通过通过下游预测任务监督张量分解并利用来自多个相关预测任务的信息，Multipar不仅可以产生更有意义的表型，而且可以为下游任务提供更好的预测性能。我们在两个现实世界中的EHR数据集上进行了广泛的实验，以证明Multipar是可扩展的，并且与现有的最新方法相比，具有更有意义的亚组和更强的预测性能，可以更好地张紧张量。

translated by 谷歌翻译

Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions

Florian Becker , Age K. Smilde , Evrim Acar

分类：机器学习 | (统计)机器学习

2022-09-01

计算表型可以无监督发现患者的亚组以及电子健康记录（EHR）的相应同时发生的医疗状况。通常，EHR数据包含人口统计信息，诊断和实验室结果。发现（新颖的）表型具有预后和治疗价值的潜力。为医生提供透明且可解释的结果是一项重要要求，也是推进精确医学的重要组成部分。低级别数据近似方法，例如矩阵（例如，非负矩阵分解）和张量分解（例如，candecomp/parafac），已经证明它们可以提供这种透明且可解释的见解。最近的发展通过合并不同的限制和正规化来促进可解释性，从而适应了低级数据近似方法。此外，它们还为EHR数据中的共同挑战提供解决方案，例如高维度，数据稀疏性和不完整性。尤其是从纵向EHR中提取时间表型，近年来引起了很多关注。在本文中，我们对计算表型的低级别近似方法进行了全面的综述。现有文献根据矩阵与张量分解归类为时间与静态表型方法。此外，我们概述了验证表型的不同方法，即评估临床意义。

translated by 谷歌翻译

Constrained tensor factorization for computational phenotyping and mortality prediction in patients with cancer

Francisco Y Cai , Chengsheng Mao , Yuan Luo

分类：机器学习

2021-12-24

背景：在美国的电子健康记录（EHR）的日益越来越多的采用创造了可计算数据的Trovers，已经应用了机器学习方法来提取有用的见解。表示为矩阵（张量）的三维类似物的EHR数据被分解成可以被解释为计算表型的二维因子。方法：我们将受限的张量分解施加到2015年至2015年西北医学企业数据仓库中患有乳腺，前列腺，结直肠癌或肺癌患者群组中的增殖和预测死亡率。在我们的实验中，我们使用监督期检查在分解算法中，通过医学指示过滤张量相同，并在分解过程中纳入额外的健康（SDOH）协变量的社会决定因素。我们定性地评估了所产生的计算表型，并通过评估它们在曲线（AUC）统计下的区域预测五年死亡率的能力。结果：医疗指示过滤导致更简洁和可解释的表型。死亡预测性能（AUC）在不同的实验条件下变化，癌症类型（乳腺：0.623-0.694，前列腺：0.603 - 0.750，结直肠：0.523-0.641和Lung：0.517 - 0.623）。通常，利用监督期的使用和SDOH协变量的结合改善了预测性能。结论：约束张量分解，适用于癌症患者的稀疏EHR数据，可以发现预测五年死亡率的计算表型。将SDOH变量的结合到分解算法是一种易于实现和有效的方法来提高预测性能。

translated by 谷歌翻译

Time Series Prediction using Deep Learning Methods in Healthcare

Mohammad Amin Morid , Olivia R. Liu Sheng , Joseph Dunbar

分类：机器学习

2021-08-30

传统机器学习方法面临两种主要挑战，在处理医疗保健预测分析任务方面。首先，医疗保健数据的高维性质需要劳动密集型和耗时的过程，为每项新任务选择适当的功能集。其次，这些方法依赖于特征工程来捕获患者数据的顺序性，这可能无法充分利用医疗事件的时间模式及其依赖性。最近的深度学习方法通过解决医疗数据的高维和时间挑战，对各种医疗保健预测任务显示了有希望的性能。这些方法可以学习关键因素（例如，医学概念或患者）的有用表示及其与高维原始或最低处理的医疗保健数据的相互作用。在本文中，我们系统地审查了专注于推进和使用深神经网络的研究，以利用患者结构化时间序列数据进行医疗保健预测任务。为了识别相关研究，搜索MEDLINE，IEEE，SCOPUS和ACM数字图书馆于2021年2月7日出版的研究。我们发现研究人员在十个研究流中为深度时间序列预测文献做出了贡献：深入学习模型，缺少价值处理，不规则处理，患者表示，静态数据包容，关注机制，解释，纳入医疗本体，学习策略和可扩展性。本研究总结了这些文献流的研究见解，确定了几个关键研究差距，并提出了未来的患者时间序列数据深入学习的研究机会。

translated by 谷歌翻译

MedML: Fusing Medical Knowledge and Machine Learning Models for Early Pediatric COVID-19 Hospitalization and Severity Prediction

Junyi Gao , Chaoqi Yang , George Heintz , Scott Barrows , Elise Albers , Mary Stapel , Sara Warfield , Adam Cross , Jimeng Sun , the N3C consortium

分类：机器学习

2022-07-25

COVID-19的大流行造成了毁灭性的经济和社会破坏，使全球医疗机构的资源紧张。这导致全国范围内呼吁模型预测Covid-19患者的住院和严重疾病，以告知有限医疗资源的分配。我们回应针对儿科人群的其中一种。为了应对这一挑战，我们使用电子健康记录研究了针对儿科人群的两项预测任务：1）预测哪些儿童更有可能住院，而2）在住院儿童中，哪些孩子更有可能出现严重的症状。我们通过新颖的机器学习模型MEDML应对国家儿科Covid-19数据挑战。 MEDML根据超过600万个医学概念的医学知识和倾向得分提取了最预测的特征，并通过图神经网络（GNN）结合了异质医学特征之间的功能间关系。我们使用来自国家队列协作（N3C）数据集的数据评估了143,605名患者的MEDML，并在143,605名患者的住院预测任务中评估了严重性预测任务的11,465名患者。我们还报告了详细的小组级和个人级特征的重要性分析，以评估模型的解释性。与最佳的基线机器学习模型相比，MEDML的AUROC得分高达7％，AUPRC得分高达14％，并且自大流行以来的所有九个国家地理区域以及所有三个月的跨度都表现良好。我们的跨学科研究团队开发了一种将临床领域知识纳入新型机器学习模型的框架的方法，该框架比当前最新的数据驱动的功能选择方法更具预测性和可解释。

translated by 谷歌翻译

A Comprehensive Benchmark for COVID-19 Predictive Modeling Using Electronic Health Records in Intensive Care: Choosing the Best Model for COVID-19 Prognosis

Junyi Gao , Yinghao Zhu , Wenqing Wang , Yasha Wang , Wen Tang , Liantao Ma

分类：机器学习

2022-09-16

COVID-19大流行对全球医疗保健系统造成了沉重的负担，并造成了巨大的社会破坏和经济损失。已经提出了许多深度学习模型来执行临床预测任务，例如使用电子健康记录（EHR）数据在重症监护病房中为Covid-19患者的死亡率预测。尽管在某些临床应用中取得了最初的成功，但目前缺乏基准测试结果来获得公平的比较，因此我们可以选择最佳模型以供临床使用。此外，传统预测任务的制定与重症监护现实世界的临床实践之间存在差异。为了填补这些空白，我们提出了两项临床预测任务，特定于结局的预测和重症监护病房中的COVID-19患者的早期死亡率预测。这两个任务是根据幼稚的停车时间和死亡率预测任务的改编，以适应COVID-19患者的临床实践。我们提出了公平，详细的开源数据预处管道，并评估了两项任务的17个最先进的预测模型，包括5个机器学习模型，6种基本的深度学习模型和6种专门为EHR设计的深度学习预测模型数据。我们使用来自两个现实世界Covid-19 EHR数据集的数据提供基准测试结果。这两个数据集都可以公开可用，而无需任何查询，并且可以根据要求访问一个数据集。我们为两项任务提供公平，可重复的基准测试结果。我们在在线平台上部署所有实验结果和模型。我们还允许临床医生和研究人员将其数据上传到平台上，并使用训练有素的模型快速获得预测结果。我们希望我们的努力能够进一步促进Covid-19预测建模的深度学习和机器学习研究。

translated by 谷歌翻译

A Probit Tensor Factorization Model For Relational Learning

Ye Liu , Rui Song , Wenbin Lu , Yanghua Xiao

分类：机器学习 | (统计)机器学习

2021-11-06

随着知识图的扩散，具有复杂多界结构的建模数据在统计关系学习领域获得了越来越大的关注。统计关系学习最重要的目标之一是链路预测，即，预测知识图中是否存在某些关系。已经提出了大量模型和算法来执行链路预测，其中张量分解方法已经证明在计算效率和预测准确性方面实现了最先进的性能。然而，现有张量分解模型的共同缺点是缺失的关系和非现有关系是以相同的方式对待，这导致信息丢失。为了解决这个问题，我们提出了一种具有探测链路的二进制张量分解模型，其不仅继承了来自经典张量分解模型的计算效率，还占关联数据的二进制性质。我们所提出的探测张量分解（PTF）模型显示了预测准确性和可解释性的优点

translated by 谷歌翻译

Medical SANSformers: Training self-supervised transformers without attention for Electronic Medical Records

Yogesh Kumar , Alexander Ilin , Henri Salo , Sangita Kulathinal , Maarit K. Leinonen , Pekka Marttinen

分类：机器学习

2021-08-31

我们利用深度顺序模型来解决预测患者医疗保健利用的问题，这可能有助于政府更好地为未来的医疗保健使用提供资源。具体地，我们研究\纺织{发散亚组}的问题，其中较小的人口小组中的结果分布大大偏离了一般人群的群体。如果亚组的尺寸非常小（例如，稀有疾病），则对不同亚组的专业模型建造专门模型的传统方法可能是有问题的。为了解决这一挑战，我们首先开发一种新的无关注顺序模型，SANSFORMERS，灌输了适合在电子医疗记录中建模临床码的归纳偏差。然后，我们通过在整个健康登记处预先培训每个模型（接近100万名患者）之前，设计了一个特定的自我监督目标，并展示其有效性，特别是稀缺数据设置，特别是在整个健康登记处（接近一百万名患者）进行微调下游任务不同的子组。我们使用两个数据来源与LSTM和变压器模型进行比较新的SANSFARER架构和辅助医疗利用预测的多任务学习目标。凭经验，无关注的Sansformer模型在实验中始终如一地执行，在大多数情况下以至少$ \ SIM 10 $ \％表现出在大多数情况下的基线。此外，在预测医院访问数量时，自我监督的预训练将在整个始终提高性能，例如通过超过$ \ sim 50 $ \％（和高度为800美元\％）。

translated by 谷歌翻译

Modeling Long-term Dependencies and Short-term Correlations in Patient Journey Data with Temporal Attention Networks for Health Prediction

Yuxi Liu , Zhenhao Zhang , Antonio Jimeno Yepes , Flora D. Salim

分类：机器学习 | 人工智能 | 自然语言处理

2022-07-13

基于电子健康记录（EHR）的健康预测建筑模型已成为一个活跃的研究领域。 EHR患者旅程数据由患者定期的临床事件/患者访问组成。大多数现有研究的重点是建模访问之间的长期依赖性，而无需明确考虑连续访问之间的短期相关性，在这种情况下，将不规则的时间间隔（并入为辅助信息）被送入健康预测模型中以捕获患者期间的潜在渐进模式。。我们提出了一个具有四个模块的新型深神经网络，以考虑各种变量对健康预测的贡献：i）堆叠的注意力模块在每个患者旅程中加强了临床事件中的深层语义，并产生访问嵌入，ii）短 - 术语时间关注模块模型在连续访问嵌入之间的短期相关性，同时捕获这些访问嵌入中时间间隔的影响，iii）长期时间关注模块模型的长期依赖模型，同时捕获时间间隔内的时间间隔的影响这些访问嵌入，iv），最后，耦合的注意模块适应了短期时间关注和长期时间注意模块的输出，以做出健康预测。对模拟III的实验结果表明，与现有的最新方法相比，我们的模型的预测准确性以及该方法的可解释性和鲁棒性。此外，我们发现建模短期相关性有助于局部先验的产生，从而改善了患者旅行的预测性建模。

translated by 谷歌翻译

SurvLatent ODE : A Neural ODE based time-to-event model with competing risks for longitudinal data improves cancer-associated Venous Thromboembolism (VTE) prediction

Intae Moon , Stefan Groha , Alexander Gusev

分类：机器学习 | (统计)机器学习

2022-04-20

从电子健康记录（EHR）数据中进行有效学习来预测临床结果，这通常是具有挑战性的，因为在不规则的时间段记录的特征和随访的损失以及竞争性事件（例如死亡或疾病进展）。为此，我们提出了一种生成的事实模型，即Survlatent Ode，该模型采用了基于基于微分方程的复发性神经网络（ODE-RNN）作为编码器，以有效地对不规则采样的输入数据进行潜在状态的动力学有效地参数化。然后，我们的模型利用所得的潜在嵌入来灵活地估计多个竞争事件的生存时间，而无需指定事件特定危害功能的形状。我们展示了我们在Mimic-III上的竞争性能，这是一种从重症监护病房收集的自由纵向数据集，预测医院死亡率以及DANA-FARBER癌症研究所（DFCI）的数据，以预测静脉血栓症（静脉血栓症（DFCI）（DFCI）（ VTE），是癌症患者的生命并发症，死亡作为竞争事件。幸存ODE优于分层VTE风险组的当前临床标准Khorana风险评分，同时提供临床上有意义且可解释的潜在表示。

translated by 谷歌翻译

ICE-NODE: Integration of Clinical Embeddings with Neural Ordinary Differential Equations

Asem Alaa , Erik Mayer , Mauricio Barahona

分类：机器学习

2022-07-05

疾病的早期诊断可能会改善健康结果，例如较高的存活率和较低的治疗成本。随着电子健康记录中的大量信息（EHR），使用机器学习（ML）方法有很大的潜力来对疾病进展进行建模，以旨在早期预测疾病发作和其他结果。在这项工作中，我们采用了神经odes的最新创新来利用EHR的全部时间信息。我们提出了冰节（将临床嵌入与神经普通微分方程的整合），该体系结构在时间上整合临床代码和神经ODE的嵌入，以学习和预测EHR中的患者轨迹。我们将我们的方法应用于公共可用的模拟III和模拟IV数据集，与最新方法相比，报告了预测结果的改进，特别是针对EHR中经常观察到的临床代码。我们还表明，冰节在预测某些医疗状况（例如急性肾衰竭和肺心脏病）方面更有能力，并且还能够随着时间的推移产生患者的风险轨迹，以进行进一步的预测。

translated by 谷歌翻译

Longitudinal patient stratification of electronic health records with flexible adjustment for clinical outcomes

Oliver Carr , Avelino Javer , Patrick Rockenschaub , Owen Parsons , Robert Dürichen

分类：机器学习

2021-11-11

纵向电子健康记录（EHR）数据的可用性增加导致改善对疾病的理解和新颖表型的发现。大多数聚类算法仅关注患者轨迹，但具有类似轨迹的患者可能具有不同的结果。寻找不同轨迹和结果的患者亚组可以引导未来的药物开发，改善临床试验的招募。我们使用可以加权的重建，结果和聚类损耗开发经常性神经网络自动拓群体以群集EHR数据，以查找不同类型的患者群集。我们展示我们的模型能够从数据偏差和结果差异中发现已知的集群，表现优于基线模型。我们展示了29,222,229美元糖尿病患者的模型性能，显示出发现患有不同轨迹和不同结果的患者的簇，可用于帮助临床决策。

translated by 谷歌翻译

Self-Supervised Graph Learning with Hyperbolic Embedding for Temporal Health Event Prediction

Chang Lu , Chandan K. Reddy , Yue Ning

分类：机器学习 | 人工智能

2021-06-09

电子健康记录（EHR）已经大量用于现代医疗保健系统，用于将患者的入场信息记录到医院。许多数据驱动方法采用EHR中的时间特征，用于预测患者的特定疾病，阅告期或诊断。然而，由于某些时间事件的监督培训中固有的标签，大多数现有的预测模型不能充分利用EHR数据。此外，对于现有的作品很难同时提供通用和个性化的解释性。为解决这些挑战，我们首先提出了一种具有信息流到分层结构的信息流的双曲线嵌入方法。我们将这些预先训练的表征纳入了图形神经网络以检测疾病并发症，并设计一种计算特定疾病和入学贡献的多级注意方法，从而提高个性化的可解释性。我们在自我监督的学习框架中提出了一个新的层次结构增强的历史预测代理任务，以充分利用EHR数据和利用医疗领域知识。我们开展一套全面的实验和案例研究，广泛使用的公开可用的EHR数据集以验证我们模型的有效性。结果表明我们的模型在预测任务和可解释能力方面的优势。

translated by 谷歌翻译

Causal Graph Recovery for Sepsis-Associated Derangements via Interpretable Hawkes Networks

Song Wei , Yao Xie , Christopher S. Josef , Rishikesan Kamaleswaran

分类：机器学习

2021-06-04

Continuous, automated surveillance systems that incorporate machine learning models are becoming increasingly common in healthcare environments. These models can capture temporally dependent changes across multiple patient variables and can enhance a clinician's situational awareness by providing an early warning alarm of an impending adverse event such as sepsis. However, most commonly used methods, e.g., XGBoost, fail to provide an interpretable mechanism for understanding why a model produced a sepsis alarm at a given time. The ``black box'' nature of many models is a severe limitation as it prevents clinicians from independently corroborating those physiologic features that have contributed to the sepsis alarm. To overcome this limitation, we propose a generalized linear model (GLM) approach to fit a Granger causal graph based on the physiology of several major sepsis-associated derangements (SADs). We adopt a recently developed stochastic monotone variational inequality (VI)-based estimator coupled with forwarding feature selection to learn the graph structure from both continuous and discrete-valued as well as regularly and irregularly sampled time series. Theoretically, we develop a non-asymptotic upper bound on the estimation error for any monotone link function in the GLM. Using synthetic and real-data examples, we demonstrate that the proposed method enjoys result interpretability while achieving comparable performance to popular methods such as XGBoost.

translated by 谷歌翻译

Semisoft Task Clustering for Multi-Task Learning

Yuzhao Zhang , Yifan Sun

分类：机器学习 | (统计)机器学习

2022-11-28

Multi-task learning (MTL) aims to improve the performance of multiple related prediction tasks by leveraging useful information from them. Due to their flexibility and ability to reduce unknown coefficients substantially, the task-clustering-based MTL approaches have attracted considerable attention. Motivated by the idea of semisoft clustering of data, we propose a semisoft task clustering approach, which can simultaneously reveal the task cluster structure for both pure and mixed tasks as well as select the relevant features. The main assumption behind our approach is that each cluster has some pure tasks, and each mixed task can be represented by a linear combination of pure tasks in different clusters. To solve the resulting non-convex constrained optimization problem, we design an efficient three-step algorithm. The experimental results based on synthetic and real-world datasets validate the effectiveness and efficiency of the proposed approach. Finally, we extend the proposed approach to a robust task clustering problem.

translated by 谷歌翻译

A Comprehensive Analytical Survey on Unsupervised and Semi-Supervised Graph Representation Learning Methods

Md. Khaledur Rahman , Ariful Azad

分类：机器学习

2021-12-20

图表表示学习是一种快速增长的领域，其中一个主要目标是在低维空间中产生有意义的图形表示。已经成功地应用了学习的嵌入式来执行各种预测任务，例如链路预测，节点分类，群集和可视化。图表社区的集体努力提供了数百种方法，但在所有评估指标下没有单一方法擅长，例如预测准确性，运行时间，可扩展性等。该调查旨在通过考虑算法来评估嵌入方法的所有主要类别的图表变体，参数选择，可伸缩性，硬件和软件平台，下游ML任务和多样化数据集。我们使用包含手动特征工程，矩阵分解，浅神经网络和深图卷积网络的分类法组织了图形嵌入技术。我们使用广泛使用的基准图表评估了节点分类，链路预测，群集和可视化任务的这些类别算法。我们在Pytorch几何和DGL库上设计了我们的实验，并在不同的多核CPU和GPU平台上运行实验。我们严格地审查了各种性能指标下嵌入方法的性能，并总结了结果。因此，本文可以作为比较指南，以帮助用户选择最适合其任务的方法。

translated by 谷歌翻译

An AO-ADMM approach to constraining PARAFAC2 on all modes

Marie Roald , Carla Schenker , Vince D. Calhoun , Tülay Adalı , Rasmus Bro , Jeremy E. Cohen , Evrim Acar

分类：机器学习 | (统计)机器学习

2021-10-04

在数据挖掘，神经科学和化学计量学在内的各个领域，分析各种数据集中的多路测量结果是一个挑战。例如，测量可能会随着时间的流逝而发展或具有不一致的时间曲线。 PARAFAC2模型已成功地用于分析此类数据，通过在一种模式（即演变模式）下允许基础因子矩阵跨切片进行更改。拟合PARAFAC2模型的传统方法是使用基于最小二乘的交替算法，该算法通过隐式估计不断发展的因子矩阵来处理Parafac2模型的恒定交叉产生约束。这种方法使对这些因素矩阵充满挑战。目前尚无算法可以灵活地将这种正规化施加，并具有一般的惩罚功能和硬性约束。为了应对这一挑战并避免隐性估计，在本文中，我们提出了一种算法，用于拟合PARAFAC2基于与乘数交替方向方法（AO-ADMM）的交替优化拟合parafac2。通过在模拟数据上进行数值实验，我们表明所提出的PARAFAC2 AO-ADMM方法允许灵活约束，准确地恢复了基础模式，并且与先进的ART相比，计算有效。我们还将模型应用于神经科学和化学计量学的两个现实世界数据集，并表明限制发展模式可改善提取模式的解释性。

translated by 谷歌翻译

A Multifaceted Benchmarking of Synthetic Electronic Health Record Generation Models

Chao Yan , Yao Yan , Zhiyu Wan , Ziqi Zhang , Larsson Omberg , Justin Guinney , Sean D. Mooney , Bradley A. Malin

分类：机器学习 | 人工智能

2022-08-02

合成健康数据在共享数据以支持生物医学研究和创新医疗保健应用的发展时有可能减轻隐私问题。基于机器学习，尤其是生成对抗网络（GAN）方法的现代方法生成的现代方法继续发展并表现出巨大的潜力。然而，缺乏系统的评估框架来基准测试方法，并确定哪些方法最合适。在这项工作中，我们引入了一个可推广的基准测试框架，以评估综合健康数据的关键特征在实用性和隐私指标方面。我们将框架应用框架来评估来自两个大型学术医疗中心的电子健康记录（EHRS）数据的合成数据生成方法。结果表明，共享合成EHR数据存在公用事业私人关系权衡。结果进一步表明，在每个用例中，在所有标准上都没有明确的方法是最好的，这使得为什么需要在上下文中评估合成数据生成方法。

translated by 谷歌翻译

Saliency-Regularized Deep Multi-Task Learning

Guangji Bai , Liang Zhao

分类：机器学习

2022-07-03

多任务学习是一个框架，可执行多个学习任务以共享知识以提高其概括能力。虽然浅做多任务学习可以学习任务关系，但它只能处理预定义的功能。现代深度多任务学习可以共同学习潜在的功能和任务共享，但任务关系却很晦涩。同样，他们预先定义哪些层和神经元应该跨任务共享，并且不能适应地学习。为了应对这些挑战，本文提出了一个新的多任务学习框架，该框架通过补充现有浅层和深层多任务学习方案的强度，共同学习潜在特征和明确的任务关系。具体而言，我们建议将任务关系建模为任务输入梯度之间的相似性，并对它们的等效性进行理论分析。此外，我们创新地提出了一个多任务学习目标，该目标可以通过新的正规机明确学习任务关系。理论分析表明，由于提出的正常化程序，概括性误差已减少。在多个多任务学习和图像分类基准上进行的广泛实验证明了所提出的方法有效性，效率以及在学习任务关系模式中的合理性。

translated by 谷歌翻译

Unsupervised pre-training of graph transformers on patient population graphs

Chantal Pellegrini , Nassir Navab , Anees Kazi

分类：机器学习

2022-07-21

预训练在机器学习的不同领域表现出成功，例如计算机视觉，自然语言处理（NLP）和医学成像。但是，尚未完全探索用于临床数据分析。记录了大量的临床记录，但是对于在小型医院收集的数据或处理罕见疾病的数据仍可能稀缺数据和标签。在这种情况下，对较大的未标记临床数据进行预训练可以提高性能。在本文中，我们提出了专为异质的多模式临床数据设计的新型无监督的预训练技术，用于通过蒙版语言建模（MLM）启发的患者预测，通过利用对人群图的深度学习来启发。为此，我们进一步提出了一个基于图形转换器的网络，该网络旨在处理异质临床数据。通过将基于掩盖的预训练与基于变压器的网络相结合，我们将基于掩盖的其他域中训练的成功转化为异质临床数据。我们使用三个医学数据集Tadpole，Mimic-III和一个败血症预测数据集，在自我监督和转移学习设置中展示了我们的预训练方法的好处。我们发现，我们提出的培训方法有助于对患者和人群水平的数据进行建模，并提高所有数据集中不同微调任务的性能。

translated by 谷歌翻译