智能论文笔记

模糊哈希是数字取证中的重要工具，可用于近似匹配，以确定数字工件之间的相似性。他们将文件的字节代码转换为可计算的字符串，这使得它们对于智能机器处理特别有趣。在这项工作中，我们提出了深度学习近似匹配（DLAM），该匹配（DLAM）在检测模糊哈希异常的准确性比传统方法更高。除了著名的聚类恶意软件应用程序外，我们还表明，模糊的哈希和深度学习确实非常适合根据某些内容（例如恶意软件）进行分类。 DLAM依赖于自然语言处理领域的基于变压器的模型，并优于现有方法。传统的模糊哈希（TLSH和SSDEEP）的尺寸有限，并且与整体文件大小相比相对较小，并且无法检测到文件异常。然而，DLAM可以在TLSH和SSDEEP的计算模糊哈希中检测此类文件相关性，即使对于异常大小不到15％也是如此。它与最先进的模糊散列算法获得了可比的结果，同时依靠更高效的哈希计算，因此可以在更大的规模上使用。

translated by 谷歌翻译

Self-supervised Representation Learning on Electronic Health Records with Graph Kernel Infomax

Hao-Ren Yao , Nairen Cao , Katina Russell , Der-Chen Chang , Ophir Frieder , Jeremy Fineman

分类：机器学习

2022-09-01

学习电子健康记录（EHRS）表示是一个杰出但未被发现的研究主题。它受益于各种临床决策支持应用，例如药物结果预测或患者相似性搜索。当前的方法集中在特定于任务的标签监督上，对矢量化的顺序EHR，这不适用于大规模无监督的方案。最近，对比度学习在自我监督的代表性学习问题上显示出巨大的成功。但是，复杂的时间性通常会降低表现。我们提出了图形内核信息，这是EHR图形表示的一种自我监督的图内学习方法，以克服先前的问题。与最新的艺术品不同，我们不会更改图形结构以构建增强视图。取而代之的是，我们使用内核子空间扩展将节点嵌入两个几何不同的流形视图中。整个框架是通过通过常用的对比目标在这两种歧管视图上对比的节点和图形表示训练的。从经验上讲，使用公开可用的基准EHR数据集，我们的方法在超过最先进的临床下游任务上产生了表现。从理论上讲，距离指标的变化自然会在不改变图形结构的情况下创建不同的视图作为数据增强。

translated by 谷歌翻译

气候变化已成为最大的全球性问题之一，越来越多地损害地球的居住地。最近的发展如加利福尼亚州和加拿大的非凡热浪，以及德国的毁灭性洪水指向气候变化在极端天气不断增长的频率下的作用。在过去的五十年中，天气和气候的数值模型已经看到了巨大的改善，但仍有严格的限制仍有待克服。空间和时间本地化预测是需要一个小时，以便有效适应措施，以尽量减少生命和财产丧失。基于人工智能的方法正在展示有希望的导致改进预测，但仍然受到必要硬件和软件所需的可用性来处理地球地球的规模所需的软硬件和软件的限制。量子计算是一种新兴范式，在几个领域中发现了潜在的适用性。在这种意见作品中，我们认为为量子计算机设计的人工智能算法的新发展 - 也称为量子人工智能（QAI） - 可以提供进一步进一步的气候变化科学所需的关键突破。预计天气和气候预测的改善将级联到众多社会福利。

translated by 谷歌翻译