智能论文笔记

An Evaluation of Low Overhead Time Series Preprocessing Techniques for Downstream Machine Learning

Matthew L. Weiss , Joseph McDonald , David Bestor , Charles Yee , Daniel Edelman , Michael Jones , Andrew Prout , Andrew Bowne , Lindsey McEvoy , Vijay Gadepally

分类：机器学习

2022-09-12

在本文中，我们将预处理技术应用于具有不同长度的多通道时间序列数据，我们称之为对齐问题，用于下游机器学习。多种原因可能发生多种渠道时间序列数据的未对准，原因有多种原因，例如丢失的数据，变化的采样率或不一致的收集时间。我们考虑从MIT SuperCloud高性能计算（HPC）中心收集的多渠道时间序列数据，其中不同的工作开始时间和HPC作业的运行时间不同，导致数据不对准。这种未对准使得为计算工作负载分类等任务构建AI/ML方法具有挑战性。在先前使用MIT SuperCloud数据集的监督分类工作的基础上，我们通过三种宽阔的低间接空间方法解决了对齐问题：从全职系列中抽样固定子集，在全职系列上执行摘要统计信息，并对系数进行取样。从映射到频域的时间序列。我们最佳性能模型的分类精度大于95％，以先前的方法对MIT SuperCloud数据集的多通道时间序列分类的表现优于5％。这些结果表明，我们的低间接费用方法与标准机器学习技术结合使用，能够达到高水平的分类准确性，并作为解决对齐问题（例如内核方法）的未来方法的基准。

translated by 谷歌翻译

Easy Differentially Private Linear Regression

Kareem Amin , Matthew Joseph , Mónica Ribero , Sergei Vassilvitskii

分类：机器学习

2022-08-15

线性回归是统计分析的基本工具。这激发了线性回归方法的开发，这些方法也满足了差异隐私，因此可以保证，学到的模型几乎没有揭示用于构建它的任何一个数据点。但是，现有的差异化解决方案假设最终用户可以轻松指定良好的数据范围和超参数。两者都有重大的实践障碍。在本文中，我们研究了一种算法，该算法使用指数机制从非私有回归模型集合中选择具有高图基深度的模型。给定用于训练$ m $型号的$ d $二维数据的$ n $样品，我们使用近似Tukey深度构建一个有效的模拟，该深度在时间$ o（d^2n + dm \ log（m））$中构建。我们发现该算法在数据范围或不需要的超参数选择的情况下获得了强大的经验性能。

translated by 谷歌翻译

E2N: Error Estimation Networks for Goal-Oriented Mesh Adaptation

Joseph G. Wallwork , Jingyi Lu , Mingrui Zhang , Matthew D. Piggott

分类：机器学习

2022-07-22

给定部分微分方程（PDE），面向目标的误差估计使我们能够了解诊断数量的兴趣数量（QOI）或目标的错误如何发生并积累在数值近似中，例如使用有限元方法。通过将误差估计分解为来自各个元素的贡献，可以制定适应方法，该方法可以修改网格，以最大程度地减少所得QOI误差的目的。但是，标准误差估计公式涉及真实的伴随解决方案，这在实践中是未知的。因此，通常的做法是用“富集”的近似值（例如，在更高的空间或精制的网格上）近似。这样做通常会导致计算成本的显着增加，这可能是损害（面向目标）自适应模拟的竞争力的瓶颈。本文的核心思想是通过选择性更换昂贵的误差估计步骤，并使用适当的配置和训练的神经网络开发“数据驱动”目标的网格适应方法。这样，甚至可以在不构造富集空间的情况下获得误差估计器。此处采用了逐元构造，该元素构造与网格几何相关的各种参数的局部值和基础问题物理物理作为输入，并且对误差估计器的相应贡献作为输出。我们证明，这种方法能够以降低的计算成本获得相同的准确性，对于与潮汐涡轮机周围流动相关的自适应网格测试用例，这些测试用例是通过其下游唤醒相互作用的，以及农场的整体功率输出作为将其视为QOI。此外，我们证明了元素元素方法意味着培训成本相当低。

translated by 谷歌翻译

Placenta Segmentation in Ultrasound Imaging: Addressing Sources of Uncertainty and Limited Field-of-View

Veronika A. Zimmer , Alberto Gomez , Emily Skelton , Robert Wright , Gavin Wheeler , Shujie Deng , Nooshin Ghavami , Karen Lloyd , Jacqueline Matthew , Bernhard Kainz

分类：计算机视觉

2022-06-29

胎儿超声（US）中胎盘的自动分割由于（i）（i）胎盘外观的高度多样性而具有挑战性我们禁止在妊娠晚期进行整个胎盘评估的观点。在这项工作中，我们通过多任务学习方法解决了这三个挑战，该方法结合了单个卷积神经网络中胎盘位置（例如，前，后部）和语义胎盘分段的分类。通过分类任务，模型可以从更大，更多样化的数据集中学习，同时在有限的训练集条件下提高分割任务的准确性。通过这种方法，我们研究了多个评估者的注释的变异性，并表明我们的自动分割（前胎盘的骰子为0.86，后胎盘的骰子为0.83），与观察者内和观察者间的变异性相比，我们的自动段性能达到了人级的性能。最后，我们的方法可以使用由三个阶段组成的多视图US采集管道提供整个胎盘分割：多探针图像采集，图像融合和图像分段。这会导致对较大结构（例如胎盘中的胎盘）的高质量分割，其图像伪像降低，这超出了单个探针的视野。

translated by 谷歌翻译

DDKtor: Automatic Diadochokinetic Speech Analysis

Yael Segal , Kasia Hitczenko , Matthew Goldrick , Adam Buchwald , Angela Roberts , Joseph Keshet

分类：机器学习

2022-06-29

参与者反复产生音节的Diadochokinetic语音任务（DDK）通常用作评估语音运动障碍的一部分。这些研究依赖于时间密集型，主观的手动分析，并且仅提供粗略的语音图片。本文介绍了两个深度神经网络模型，这些模型会自动从未注释，未转录的语音中分割辅音和元音。两种模型都在原始波形上工作，并使用卷积层进行特征提取。第一个模型基于LSTM分类器，然后是完全连接的层，而第二个模型则添加了更多的卷积层，然后是完全连接的层。这些模型预测的这些分割用于获得语音速率和声音持续时间的度量。年轻健康个体数据集的结果表明，我们的LSTM模型的表现优于当前的最新系统，并且与受过训练的人类注释相当。此外，在对帕金森氏病数据集的看不见的老年人进行评估时，LSTM模型还与受过训练的人类注释者相当。

translated by 谷歌翻译

An autonomous robot for pruning modern, planar fruit trees

Alexander You , Nidhi Parayil , Josyula Gopala Krishna , Uddhav Bhattarai , Ranjan Sapkota , Dawood Ahmed , Matthew Whiting , Manoj Karkee , Cindy M. Grimm , Joseph R. Davidson

分类：机器人

2022-06-14

果树的休眠修剪是维持树木健康和确保高质量果实的重要任务。由于劳动力的可用性降低，修剪是机器人自动化的主要候选者。但是，修剪也代表了机器人的独特困难问题，需要在可变照明条件下以及在复杂的，高度非结构化的环境中进行感知，修剪点的确定和操纵。在本文中，我们介绍了一种用于修剪甜樱桃树的系统（在平面树建筑中，称为直立的果实分支配置），该系统整合了我们先前关于感知和操纵的工作的各种子系统。最终的系统能够完全自主运行，并且需要对环境的最低控制。我们通过在甜蜜的樱桃果园中进行现场试验来验证系统的性能，最终取得了58％的削减速度。尽管不完全稳健，并且需要改善吞吐量，但我们的系统是第一个在果树上运行的系统，并代表了将来可以改进的有用的基础平台。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Assessing Human Interaction in Virtual Reality With Continually Learning Prediction Agents Based on Reinforcement Learning Algorithms: A Pilot Study

Dylan J. A. Brenneis , Adam S. Parker , Michael Bradley Johanson , Andrew Butcher , Elnaz Davoodi , Leslie Acker , Matthew M. Botvinick , Joseph Modayil , Adam White , Patrick M. Pilarski

分类：人工智能

2021-12-14

人工智能系统越来越涉及持续学习，以实现在系统培训期间不遇到的一般情况下的灵活性。与自治系统的人类互动广泛研究，但在系统积极学习的同时，研究发生了迄今为止发生的互动，并且可以在几分钟内明显改变其行为。在这项试验研究中，我们调查如何在代理商发展能力时如何发展人类和不断学习的预测代理人之间的互动。此外，我们可以比较两个不同的代理架构来评估代理设计中的代表性选择如何影响人工代理交互。我们开发虚拟现实环境和基于时间的预测任务，其中从增强学习（RL）算法增强人类预测中学到的预测。我们评估参与者在此任务中的性能和行为如何在代理类型中不同，使用定量和定性分析。我们的研究结果表明，系统的人类信任可能受到与代理人的早期互动的影响，并且反过来的信任会影响战略行为，但试点研究的限制排除了任何结论的声明。我们将信任作为互动的关键特征，以考虑基于RL的技术在考虑基于RL的技术时，并对这项研究进行了几项建议，以准备更大规模的调查。本文的视频摘要可以在https://youtu.be/ovyjdnbqtwq找到。

translated by 谷歌翻译

Shape-Dependent Multi-Weight Magnetic Artificial Synapses for Neuromorphic Computing

Thomas Leonard , Samuel Liu , Mahshid Alamdar , Can Cui , Otitoaleke G. Akinola , Lin Xue , T. Patrick Xiao , Joseph S. Friedman , Matthew J. Marinella , Christopher H. Bennett

分类：神经与进化计算

2021-11-22

在神经形态计算中，人工突触提供了一种基于来自神经元的输入来设置的多重导电状态，类似于大脑。可能需要超出多重权重的突触的附加属性，并且可以取决于应用程序，需要需要从相同材料生成不同的突触行为。这里，我们基于使用磁隧道结和磁畴壁的磁性材料测量人造突触。通过在单个磁隧道结下面的畴壁轨道中制造光刻槽口，我们实现了4-5个稳定的电阻状态，可以使用自旋轨道扭矩电气可重复控制。我们分析几何形状对突触行为的影响，表明梯形装置具有高可控性的不对称性重量，而直线装置具有较高的随机性，但具有稳定的电阻水平。设备数据被输入到神经形态计算模拟器中以显示特定于应用程序突触函数的有用性。实施应用于流式的时尚 - MNIST数据的人工神经网络，我们表明梯形磁突出可以用作高效在线学习的元塑功能。为CiFar-100图像识别实施卷积神经网络，我们表明直流突触由于其电阻水平的稳定性而达到近乎理想的推理精度。这项工作显示多重磁突触是神经形态计算的可行技术，并为新兴人工突触技术提供设计指南。

translated by 谷歌翻译

Recognizing Families In the Wild (RFIW): The 5th Edition

Joseph P. Robinson , Can Qin , Ming Shao , Matthew A. Turk , Rama Chellappa , Yun Fu

分类：计算机视觉

2021-10-31

识别野外（RFIW）的家庭，作为数据挑战，与第16届IEEE国际自动面部和手势识别（FG）一起举行，是一种大规模的多轨视觉亲属识别评估。这是我们第五版RFIW，我们继续努力吸引学者，将专业人士，发布新工作和讨论前景。在本文中，我们总结了今年RFIW三个任务的提交：特别是，我们审查了亲属验证，三对象验证和家庭成员搜索和检索的结果。我们来看看RFIW问题，以及分享当前的努力，并为未来的未来方向提出建议。

translated by 谷歌翻译