智能论文笔记

Beyond the Hype: A Real-World Evaluation of the Impact and Cost of Machine Learning-Based Malware Detection

Robert A. Bridges , Sean Oesch , Miki E. Verma , Michael D. Iannacone , Kelly M. T. Huffer , Brian Jewell , Jeff A. Nichols , Brian Weber , Justin M. Beaver , Jared M. Smith

分类：机器学习

2020-12-16

在本文中，我们介绍了四种突出的恶意软件检测工具的科学评估，以帮助组织提出两个主要问题：基于ML的工具在多大程度上对以前和从未见过的文件进行了准确的分类？是否值得购买网络级恶意软件检测器？为了识别弱点，我们针对各种文件类型的总计3,536个文件（2,554或72 \％恶意，982或28 \％良性）测试了每个工具，包括数百个恶意零日，polyglots和apt-style-style style文件，在多个协议上交付。我们介绍了有关检测时间和准确性的统计结果，请考虑互补分析（一起使用多个工具），并提供了近期成本效益评估程序的两种新颖应用。尽管基于ML的工具在检测零日文件和可执行文件方面更有效，但基于签名的工具仍然是总体上更好的选择。两种基于网络的工具都与任何一种主机工具配对时都可以进行大量（模拟）节省，但两者在HTTP或SMTP以外的协议上都显示出较差的检测率。我们的结果表明，所有四个工具都具有几乎完美的精度但令人震惊的召回率，尤其是在可执行文件和Office文件以外的文件类型上 - 未检测到37％的恶意软件，包括所有Polyglot文件。给出了研究人员的优先事项，并给出了最终用户的外卖。

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

A Review of Sparse Expert Models in Deep Learning

William Fedus , Jeff Dean , Barret Zoph

分类：机器学习 | 自然语言处理

2022-09-04

稀疏的专家模型是一个三十年来的概念，作为深度学习中流行的建筑。这类体系结构包括专家的混合物，交换变压器，路由网络，基础层等，所有这些都以一个统一的想法，即每个示例都由参数的一个子集进行。通过这样做，稀疏度将参数计数与每个示例的计算分解，从而允许使用极大但有效的模型。最终的模型显示了各种领域的显着改善，例如自然语言处理，计算机视觉和语音识别。我们回顾了稀疏专家模型的概念，提供了对常见算法的基本描述，将深度学习时代的进步进行上下文化，并通过突出未来工作的领域来结束。

translated by 谷歌翻译

Development and Validation of ML-DQA -- a Machine Learning Data Quality Assurance Framework for Healthcare

Mark Sendak , Gaurav Sirdeshmukh , Timothy Ochoa , Hayley Premo , Linda Tang , Kira Niederhoffer , Sarah Reed , Kaivalya Deshpande , Emily Sterrett , Melissa Bauer

分类： (统计)机器学习 | 机器学习

2022-08-04

机器学习和临床研究社区利用现实世界数据（RWD）的方法，包括电子健康记录中捕获的数据（EHR）截然不同。虽然临床研究人员谨慎使用RWD进行临床研究，但用于医疗团队的ML会消费公共数据集，并以最少的审查来开发新算法。这项研究通过开发和验证ML-DQA来弥合这一差距，ML-DQA是基于RWD最佳实践的数据质量保证框架。 ML-DQA框架适用于两个地理位置的五个ML项目，分别是不同的医疗状况和不同的人群。在这五个项目中，共收集了247,536名患者的RWD，共有2,999项质量检查和24份质量报告。出现了五种可推广的实践：所有项目都使用类似的方法来分组冗余数据元素表示；所有项目都使用自动实用程序来构建诊断和药物数据元素；所有项目都使用了一个共同的基于规则的转换库；所有项目都使用统一的方法将数据质量检查分配给数据元素；所有项目都使用类似的临床裁决方法。包括临床医生，数据科学家和受训者在内的平均有5.8个人参与每个项目实施ML-DQA，每个项目平均进行了23.4个数据元素。这项研究证明了ML-DQA在医疗项目中的重要性作用，并为团队提供了开展这些基本活动的框架。

translated by 谷歌翻译

Multimodal Hydrostatic Actuators for Wearable Robots: A Preliminary Assessment of Mass-Saving and Energy-Efficiency Opportunities

Jeff Denis , Alex Lecavalier , Jean-Sebastien Plante , Alexandre Girard

分类：机器人

2022-07-06

可穿戴机器人受到执行器表演的限制，因为它们必须承担自己的电力系统和能源的重量。本文探讨了利用混合模式通过使用液压阀动态重新配置静液压执行器的连接来利用混合模式以轻巧有效的系统来满足多个操作点的想法。分析的机会包括1）在高度齿轮电源或快速电源之间切换，2）动态连接能量蓄能器，3）使用锁定机制进行固定。基于膝盖外骨骼案例研究分析，结果表明，齿轮比之间的切换可以导致更轻，更有效的执行器。此外，结果表明，使用累加器提供预紧力的连续力具有巨大的质量潜力，但如果用作短瞬态的功率助推器，则不会显着降低质量。最后，如果工作周期频繁停止，使用锁定阀可以稍微降低电池质量。提出的多模式方案的操作原理用一氧化碳原型证明。

translated by 谷歌翻译

A Lightweight Force-Controllable Wearable Arm Based on Magnetorheological-Hydrostatic Actuators

Catherine Véronneau , Jeff Denis , Louis-Philippe Lebel , Marc Denninger , Jean-Sébastien Plante , Alexandre Girard

分类：机器人

2022-06-27

超级机器人四肢（SRL）是可穿戴的机器人，通过充当同事，到达物体，支撑人的武器等来增强人类能力。但是，现有的SRL缺乏可控制互动力所需的机械背景和带宽作为绘画，操纵脆弱的物体等。具有高带宽的高度背景，而最小化重量则带来了由常规电磁执行器的有限表现施加的重大技术挑战。本文研究了使用磁性（MR）离合器耦合到低摩擦式静液传动的可行性，以提供高功能强大但可轻巧，可控制的SRL。设计和建造了2.7千克二线可穿戴机器人手臂。肩膀和肘关节的设计可提供39和25 nm，运动范围为115和180 {\ deg}。在一氧化基督测试台上进行的实验研究并在分析上进行了验证，即使在与外部阻抗相互作用时，也表明了高力带宽（> 25 Hz），并且能够控制相互作用的能力。此外，研究并通过实验研究了三种力对照方法：开环，闭环力和压力上的闭环。所有三种方法均显示为有效。总体而言，拟议的MR-Hydrstoratic致动系统非常适合与人类和环境相互作用的轻量级SRL，从而增加了无法预测的干扰。

translated by 谷歌翻译

Low-resource Learning with Knowledge Graphs: A Comprehensive Survey

Jiaoyan Chen , Yuxia Geng , Zhuo Chen , Jeff Z. Pan , Yuan He , Wen Zhang , Ian Horrocks , Huajun Chen

分类：机器学习 | 人工智能

2021-12-18

机器学习方法尤其是深度神经网络取得了巨大的成功，但其中许多往往依赖于一些标记的样品进行训练。在真实世界的应用中，我们经常需要通过例如具有新兴预测目标和昂贵的样本注释的动态上下文来解决样本短缺。因此，低资源学习，旨在学习具有足够资源（特别是培训样本）的强大预测模型，现在正在被广泛调查。在所有低资源学习研究中，许多人更喜欢以知识图（kg）的形式利用一些辅助信息，这对于知识表示变得越来越受欢迎，以减少对标记样本的依赖。在这项调查中，我们非常全面地审查了90美元的报纸关于两个主要的低资源学习设置 - 零射击学习（ZSL）的预测，从未出现过训练，而且很少拍摄的学习（FSL）预测的新类仅具有可用的少量标记样本。我们首先介绍了ZSL和FSL研究中使用的KGS以及现有的和潜在的KG施工解决方案，然后系统地分类和总结了KG感知ZSL和FSL方法，将它们划分为不同的范例，例如基于映射的映射，数据增强，基于传播和基于优化的。我们接下来呈现了不同的应用程序，包括计算机视觉和自然语言处理中的kg增强预测任务，还包括kg完成的任务，以及每个任务的一些典型评估资源。我们最终讨论了一些关于新学习和推理范式的方面的一些挑战和未来方向，以及高质量的KGs的建设。

translated by 谷歌翻译

Cross-Domain Federated Learning in Medical Imaging

Vishwa S Parekh , Shuhao Lai , Vladimir Braverman , Jeff Leal , Steven Rowe , Jay J Pillai , Michael A Jacobs

分类：人工智能 | 计算机视觉 | 机器学习

2021-12-18

在医学成像领域越来越多地探索联合学习，以培训在不同数据中心分布在不同数据中心的大规模数据集上的深入学习模型，同时通过避免转移敏感患者信息来保护隐私。在此稿件中，我们在多域的多域的多任务设置中探索联合学习，其中不同的参与节点可以包含来自不同域的数据集，并训练以解决不同的任务。我们评估了两种不同实验设置的对象检测和分段任务的跨域联合学习：多模态和多器官。我们对跨领域联合学习框架的实验的结果非常令人鼓舞，对于器官定位，0.79的重叠相似性和0.65用于病变分割。我们的结果展示了在不共享来自不同域的数据的多域，多任务深度学习模型中联合学习的潜力。

translated by 谷歌翻译

PyTorch Connectomics: A Scalable and Flexible Segmentation Framework for EM Connectomics

Zudi Lin , Donglai Wei , Jeff Lichtman , Hanspeter Pfister

分类：计算机视觉

2021-12-10

我们展示了Pytorch Connectomics（Pytc），一个开源深度学习框架，用于体积显微镜图像的语义和实例分割，基于Pytorch。我们展示了Pytc在Connectomics领域的有效性，其旨在在纳米分辨率下进行线粒体，突触像Mitochondria这样的细胞器，以了解动物脑中的神经元通信，代谢和发育。 Pytc是一个可伸缩且灵活的工具箱，可以在不同的尺度上处理数据集，并支持多任务和半监督学习，以更好地利用昂贵的专家注释和培训期间的大量未标记数据。通过在不编码的情况下改变配置选项并且适用于不同组织和成像方式的其他2D和3D分段任务，可以在Pytc中容易地实现这些功能。定量方面，我们的框架在Cremi挑战中实现了突触裂缝分割的最佳性能（以相对6.1美元\％$）和线粒体和神经元核细胞分割的竞争性能。代码和教程在https://connectomics.readthedocs.io上公开提供。

translated by 谷歌翻译

How to Train Your Neural Network: A Comparative Evaluation

Shu-Huai Lin , Daniel Nichols , Siddharth Singh , Abhinav Bhatele

分类：机器学习 | 人工智能

2021-11-09

深度学习领域目睹了对极端计算和内存密集型神经网络的显着转变。这些较新的较大模型使研究人员能够推进各种领域的最先进的工具。这种现象刺激了在更多的硬件加速器上产生了针对神经网络的分布式训练的算法。在本文中，我们讨论并比较了当前的最先进的框架，以实现大规模的分布式深度学习。首先，我们调查分布式学习中的当前实践，并确定所使用的不同类型的并行性。然后，我们提出了对大型图像和语言培训任务的性能进行了经验结果。此外，我们解决了他们的统计效率和内存消耗行为。根据我们的结果，我们讨论了阻碍性能的每个框架的算法和实现部分。

translated by 谷歌翻译