智能论文笔记

Model interpretation using improved local regression with variable importance

Gilson Y. Shimizu , Rafael Izbicki , Andre C. P. L. F. de Carvalho

分类： (统计)机器学习 | 机器学习

2022-09-12

关于使用ML模型的一个基本问题涉及其对提高决策透明度的预测的解释。尽管已经出现了几种可解释性方法，但已经确定了有关其解释可靠性的一些差距。例如，大多数方法都是不稳定的（这意味着它们在数据中提供了截然不同的解释），并且不能很好地应对无关的功能（即与标签无关的功能）。本文介绍了两种新的可解释性方法，即Varimp和Supclus，它们通过使用局部回归拟合的加权距离来克服这些问题，以考虑可变重要性。 Varimp生成了每个实例的解释，可以应用于具有更复杂关系的数据集，而Supclus解释了具有类似说明的实例集群，并且可以应用于可以找到群集的较简单数据集。我们将我们的方法与最先进的方法进行了比较，并表明它可以根据几个指标产生更好的解释，尤其是在具有无关特征的高维问题中，以及特征与目标之间的关系是非线性的。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Low-Complexity Loeffler DCT Approximations for Image and Video Coding

D. F. G. Coelho , R. J. Cintra , F. M. Bayer , S. Kulasekera , A. Madanayake , P. A. C. Martinez , T. L. T. Silveira , R. S. Oliveira , V. S. Dimitrov

分类：计算机视觉

2022-07-29

本文基于Loeffler离散余弦变换（DCT）算法引入了矩阵参数化方法。结果，提出了一类新的八点DCT近似值，能够统一文献中几个八点DCT近似的数学形式主义。帕累托效率的DCT近似是通过多准则优化获得的，其中考虑了计算复杂性，接近性和编码性能。有效的近似及其缩放的16和32点版本嵌入了图像和视频编码器中，包括类似JPEG的编解码器以及H.264/AVC和H.265/HEVC标准。将结果与未修饰的标准编解码器进行比较。在Xilinx VLX240T FPGA上映射并实现了有效的近似值，并评估了面积，速度和功耗。

translated by 谷歌翻译

Evaluation of Different Annotation Strategies for Deployment of Parking Spaces Classification Systems

Andre G. Hochuli , Alceu S. Britto Jr. , Paulo R. L. de Almeida , Williams B. S. Alves , Fabio M. C. Cagni

分类：计算机视觉

2022-07-22

当使用基于视觉的方法对被占用和空的空地之间的单个停车位进行分类时，人类专家通常需要注释位置，并标记包含目标停车场中收集的图像的训练集，以微调系统。我们建议研究三种注释类型（多边形，边界框和固定尺寸的正方形），提供停车位的不同数据表示。理由是阐明手工艺注释精度和模型性能之间的最佳权衡。我们还调查了在目标停车场微调预训练型号所需的带注释的停车位数。使用PKLOT数据集使用的实验表明，使用低精度注释（例如固定尺寸的正方形），可以将模型用少于1,000个标记的样品微调到目标停车场。

translated by 谷歌翻译

Learning Physics from the Machine: An Interpretable Boosted Decision Tree Analysis for the Majorana Demonstrator

I. J. Arnquist , F. T. Avignone III , A. S. Barabash , C. J. Barton , K. H. Bhimani , E. Blalock , B. Bos , M. Busch , M. Buuck , T. S. Caldwell

分类：机器学习

2022-07-21

Majorana示威者是一项领先的实验，寻找具有高纯净锗探测器（HPGE）的中性s中性双β衰变。机器学习提供了一种最大化这些检测器提供的信息量的新方法，但是与传统分析相比，数据驱动的性质使其不可解释。一项可解释性研究揭示了机器的决策逻辑，使我们能够从机器中学习以反馈传统分析。在这项工作中，我们介绍了Majorana演示者数据的第一个机器学习分析。这也是对任何锗探测器实验的第一个可解释的机器学习分析。训练了两个梯度增强的决策树模型，以从数据中学习，并进行了基于游戏理论的模型可解释性研究，以了解分类功率的起源。通过从数据中学习，该分析识别重建参数之间的相关性，以进一步增强背景拒绝性能。通过从机器中学习，该分析揭示了新的背景类别对相互利用的标准Majorana分析的重要性。该模型与下一代锗探测器实验（如传说）高度兼容，因为它可以同时在大量探测器上进行训练。

translated by 谷歌翻译

Complete identification of complex salt geometries from inaccurate migrated subsurface offset gathers using deep learning

Ana Paula O. Muller , Jesse C. Costa , Clecio R. Bom , Elisangela L. Faria , Matheus Klatt , Gabriel Teixeira , Marcelo P. de Albuquerque , Marcio P. de Albuquerque

分类：计算机视觉

2022-04-20

Delimiting salt inclusions from migrated images is a time-consuming activity that relies on highly human-curated analysis and is subject to interpretation errors or limitations of the methods available. We propose to use migrated images produced from an inaccurate velocity model (with a reasonable approximation of sediment velocity, but without salt inclusions) to predict the correct salt inclusions shape using a Convolutional Neural Network (CNN). Our approach relies on subsurface Common Image Gathers to focus the sediments' reflections around the zero offset and to spread the energy of salt reflections over large offsets. Using synthetic data, we trained a U-Net to use common-offset subsurface images as input channels for the CNN and the correct salt-masks as network output. The network learned to predict the salt inclusions masks with high accuracy; moreover, it also performed well when applied to synthetic benchmark data sets that were not previously introduced. Our training process tuned the U-Net to successfully learn the shape of complex salt bodies from partially focused subsurface offset images.

translated by 谷歌翻译

Your Face Mirrors Your Deepest Beliefs-Predicting Personality and Morals through Facial Emotion Recognition

P. A. Gloor , A. Fronzetti Colladon , E. Altuntas , C. Cetinkaya , M. F. Kaiser , L. Ripperger , T. Schaefer

分类：计算机视觉 | 机器学习

2021-12-23

我们真的可以“读眼中的思想”吗？此外，AI可以帮助我们吗？本文通过引入机器学习系统来回答这两个问题，该系统在他们的脸上预测个人的人格特征。通过在观看一系列15个不同类型的短视频的同时跟踪个人面孔的情感响应来跟踪个人面孔的情绪反应。为了校准系统，我们邀请了85人观看了视频，而他们的情绪反应是通过他们的面部表情分析的。与此同时，这些人还采取了四次验证的人格特征和道德价值观调查：修订的新FFI人格库存，海底道德基础测试，施瓦茨个人价值体系以及特定于域特定的风险规模（ Dospert）。我们发现，通过对脸部所示的情绪反应，可以通过它们的情绪反应来预测个人的人格特征和道德价值，使用梯度提升的树木的准确性高达86％。我们还发现，不同的视频更好地预测不同的人格特征，换句话说，没有单个视频将为所有人格特征提供准确的预测，但是它是对允许准确预测的不同视频的混合的响应。

translated by 谷歌翻译

A pragmatic approach to estimating average treatment effects from EHR data: the effect of prone positioning on mechanically ventilated COVID-19 patients

Adam Izdebski , Patrick J. Thoral , Robbert C. A. Lalisang , Dean M. McHugh , Diederik Gommers , Olaf L. Cremer , Rob J. Bosman , Sander Rigter , Evert-Jan Wils , Tim Frenzel

分类：机器学习 | 人工智能

2021-09-14

尽管近期因因果推断领域的进展，迄今为止没有关于从观察数据的收集治疗效应估算的方法。对临床实践的结果是，当缺乏随机试验的结果时，没有指导在真实情景中似乎有效的指导。本文提出了一种务实的方法，以获得从观察性研究的治疗效果的初步但稳健地估算，为前线临床医生提供对其治疗策略的信心程度。我们的研究设计适用于一个公开问题，估算Covid-19密集护理患者的拳击机动的治疗效果。

translated by 谷歌翻译

The Dark Machines Anomaly Score Challenge: Benchmark Data and Model Independent Event Classification for the Large Hadron Collider

T. Aarrestad , M. van Beekveld , M. Bona , A. Boveia , S. Caron , J. Davies , A. De Simone , C. Doglioni , J. M. Duarte , A. Farbin

分类： (统计)机器学习

2021-05-28

我们描述了作为黑暗机器倡议和LES Houches 2019年物理学研讨会进行的数据挑战的结果。挑战的目标是使用无监督机器学习算法检测LHC新物理学的信号。首先，我们提出了如何实现异常分数以在LHC搜索中定义独立于模型的信号区域。我们定义并描述了一个大型基准数据集，由> 10亿美元的Muton-Proton碰撞，其中包含> 10亿美元的模拟LHC事件组成。然后，我们在数据挑战的背景下审查了各种异常检测和密度估计算法，我们在一组现实分析环境中测量了它们的性能。我们绘制了一些有用的结论，可以帮助开发无监督的新物理搜索在LHC的第三次运行期间，并为我们的基准数据集提供用于HTTPS://www.phenomldata.org的未来研究。重现分析的代码在https://github.com/bostdiek/darkmachines-unsupervisedChallenge提供。

translated by 谷歌翻译

A Physics-Informed Neural Network to Model Port Channels

Marlon S. Mathias , Marcel R. de Barros , Jefferson F. Coelho , Lucas P. de Freitas , Felipe M. Moreno , Caio F. D. Netto , Fabio G. Cozman , Anna H. R. Costa , Eduardo A. Tannuri , Edson S. Gomi

分类：机器学习

2022-12-20

We describe a Physics-Informed Neural Network (PINN) that simulates the flow induced by the astronomical tide in a synthetic port channel, with dimensions based on the Santos - S\~ao Vicente - Bertioga Estuarine System. PINN models aim to combine the knowledge of physical systems and data-driven machine learning models. This is done by training a neural network to minimize the residuals of the governing equations in sample points. In this work, our flow is governed by the Navier-Stokes equations with some approximations. There are two main novelties in this paper. First, we design our model to assume that the flow is periodic in time, which is not feasible in conventional simulation methods. Second, we evaluate the benefit of resampling the function evaluation points during training, which has a near zero computational cost and has been verified to improve the final model, especially for small batch sizes. Finally, we discuss some limitations of the approximations used in the Navier-Stokes equations regarding the modeling of turbulence and how it interacts with PINNs.

translated by 谷歌翻译