智能论文笔记

Deep Labeling of fMRI Brain Networks Using Cloud Based Processing

Sejal Ghate , Alberto Santa-Maria Pang , Ivan Tarapov , Haris I Sair , Craig K Jones

分类：机器学习

2022-09-16

静止状态fMRI是一种成像方式，它通过信号变化揭示了大脑活动的定位，这就是所谓的静息状态网络（RSN）。该技术正在在神经外科预制范围内广受欢迎，以可视化功能区域并评估区域活动。 RS-FMRI网络的标签需要主题的专业知识并且耗时，因此需要自动分类算法。尽管AI在医学诊断中的影响表现出了很大的进步。在临床环境中部署和维护它们是未满足的需求。我们提出了一条端到端可重复的管道，该管道将RS-FMRI的图像处理结合在基于云的工作流程中，同时使用深度学习来自动化RSN的分类。我们已经构建了可重现的Azure机器学习基于云的医学成像概念管道，用于fMRI分析，集成了流行的FMRIB软件库（FSL）工具包。为了证明使用大型数据集的临床应用，我们比较了三个神经网络体系结构，以分类从处理后的RS-FMRI中得出的更深型RSN。这三种算法是：MLP，基于2D投影的CNN和一个完全3D CNN分类网络。每种网络都在RS-FMRI背面项目的独立组件上训练，每种分类方法的精度> 98％。

translated by 谷歌翻译

Discovering Language Model Behaviors with Model-Written Evaluations

Ethan Perez , Sam Ringer , Kamilė Lukošiūtė , Karina Nguyen , Edwin Chen , Scott Heiner , Craig Pettit , Catherine Olsson , Sandipan Kundu , Saurav Kadavath

分类：自然语言处理 | 人工智能 | 机器学习

2022-12-19

As language models (LMs) scale, they develop many novel behaviors, good and bad, exacerbating the need to evaluate how they behave. Prior work creates evaluations with crowdwork (which is time-consuming and expensive) or existing data sources (which are not always available). Here, we automatically generate evaluations with LMs. We explore approaches with varying amounts of human effort, from instructing LMs to write yes/no questions to making complex Winogender schemas with multiple stages of LM-based generation and filtering. Crowdworkers rate the examples as highly relevant and agree with 90-100% of labels, sometimes more so than corresponding human-written datasets. We generate 154 datasets and discover new cases of inverse scaling where LMs get worse with size. Larger LMs repeat back a dialog user's preferred answer ("sycophancy") and express greater desire to pursue concerning goals like resource acquisition and goal preservation. We also find some of the first examples of inverse scaling in RL from Human Feedback (RLHF), where more RLHF makes LMs worse. For example, RLHF makes LMs express stronger political views (on gun rights and immigration) and a greater desire to avoid shut down. Overall, LM-written evaluations are high-quality and let us quickly discover many novel LM behaviors.

translated by 谷歌翻译

Measuring Progress on Scalable Oversight for Large Language Models

Samuel R. Bowman , Jeeyoon Hyun , Ethan Perez , Edwin Chen , Craig Pettit , Scott Heiner , Kamile Lukosuite , Amanda Askell , Andy Jones , Anna Chen

分类：人工智能 | 自然语言处理

2022-11-04

Developing safe and useful general-purpose AI systems will require us to make progress on scalable oversight: the problem of supervising systems that potentially outperform us on most skills relevant to the task at hand. Empirical work on this problem is not straightforward, since we do not yet have systems that broadly exceed our abilities. This paper discusses one of the major ways we think about this problem, with a focus on how to turn it into one that can be productively studied empirically. We first present an experimental design centered on choosing tasks for which human specialists succeed but unaided humans and current general AI systems fail. We then present a proof-of-concept experiment following meant to demonstrate a key feature of this experimental design and show its viability with two question-answering tasks: MMLU and time-limited QuALITY. On these tasks, we find that human participants who interact with an unreliable large-language-model dialog assistant through chat -- a trivial baseline strategy for scalable oversight -- substantially outperform both the model alone and their own unaided performance. These results are an encouraging sign that scalable oversight will be tractable to study with present models and bolster recent findings that large language models can productively assist humans with difficult tasks.

translated by 谷歌翻译

Cross-Modal Knowledge Transfer Without Task-Relevant Source Data

Sk Miraj Ahmed , Suhas Lohit , Kuan-Chuan Peng , Michael J. Jones , Amit K. Roy-Chowdhury

分类：计算机视觉

2022-09-08

现在，具有成本效益的深度和红外传感器作为常规RGB传感器的替代方案已成为现实，并且在自主导航和遥控传感等域中具有比RGB的优势。因此，建立计算机视觉和深度学习系统以进行深度和红外数据至关重要。但是，仍然缺乏针对这些模式的大型标签数据集。在这种情况下，将知识从源模式（RGB）的良好标记的大型数据集训练的神经网络转移到在目标模式（深度，红外等）上工作的神经网络具有很大价值。出于内存和隐私等原因，可能无法访问源数据，并且知识转移需要仅与源模型一起使用。我们描述了一个有效的解决方案，插座：无源的跨模式知识转移，用于将知识从一个源模式转移到不同目标模式的具有挑战性的任务，而无需访问与任务相关的源数据。该框架使用配对的任务 - IRRELELERVANT数据以及将目标特征的平均值和方差与源模型中存在的批处理统计信息匹配，从而减少了模态差距。我们通过广泛的实验表明，我们的方法明显优于无法解释模式差距的分类任务的现有无源方法。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Lossy compression of multidimensional medical images using sinusoidal activation networks: an evaluation study

Matteo Mancini , Derek K. Jones , Marco Palombo

分类：计算机视觉 | 机器学习

2022-08-02

在这项工作中，我们评估了如何利用具有周期性激活功能的神经网络可靠地压缩大型多维医学图像数据集，并将概念验证应用应用于4D扩散加权MRI（DMRI）。在医学成像景观中，多维MRI是开发对基础组织微观结构既敏感又具有特异性的生物标志物的关键研究领域。但是，这些数据的高维质在存储和共享功能和相关成本方面构成了挑战，需要适当的算法能够在低维空间中表示信息。深度学习中的最新理论发展表明了周期性激活函数如何成为隐式神经表示图像的强大工具，并且可以用于压缩2D图像。在这里，我们将此方法扩展到4D图像，并展示如何通过正弦激活网络的参数准确地表示任何给定的4D DMRI数据集，从而达到数据压缩率是标准放气算法的10倍。我们的结果表明，所提出的方法优于基准relu和tanh激活感知到均方根误差，峰值信噪比和结构相似性指数。随后使用张量和球形谐波表示的随后分析表明，所提出的损耗压缩可准确再现原始数据的特征，从而导致相对误差约5至10倍，比基准JPEG2000有损耗压缩低约5至10倍，与标准预处理步骤相似，例如MP-PCA表示，表明在当前接受的临床应用水平内丧失信息。

translated by 谷歌翻译

Sustainable AI Processing at the Edge

Sébastien Ollivier , Sheng Li , Yue Tang , Chayanika Chaudhuri , Peipei Zhou , Xulong Tang , Jingtong Hu , Alex K. Jones

分类：人工智能

2022-07-04

边缘计算是加速机器学习算法支持移动设备的流行目标，而无需通信潜伏在云中处理它们。机器学习的边缘部署主要考虑传统问题，例如其安装的交换约束（尺寸，重量和功率）。但是，考虑到体现能量和碳的重要贡献，这种指标不足以考虑计算的环境影响。在本文中，我们探讨了用于推理和在线培训的卷积神经网络加速引擎的权衡。特别是，我们探讨了内存处理（PIM）方法，移动GPU加速器以及最近发布的FPGA的使用，并将它们与新颖的赛车记忆PIM进行比较。用赛车记忆PIM替换支持PIM的DDR3可以恢复其体现的能量，以至于1年。对于高活动比，与支持PIM的赛车记忆相比，移动GPU可以更可持续，但具有更高的体现能量可以克服。

translated by 谷歌翻译

Weed Recognition using Deep Learning Techniques on Class-imbalanced Imagery

A S M Mahmudul Hasan , Ferdous Sohel , Dean Diepeveen , Hamid Laga , Michael G. K. Jones

分类：计算机视觉 | 人工智能

2021-12-15

大多数杂草物种都会通过竞争高价值作物所需的营养而产生对农业生产力的不利影响。手动除草对于大型种植区不实用。已经开展了许多研究，为农业作物制定了自动杂草管理系统。在这个过程中，其中一个主要任务是识别图像中的杂草。但是，杂草的认可是一个具有挑战性的任务。它是因为杂草和作物植物的颜色，纹理和形状类似，可以通过成像条件，当记录图像时的成像条件，地理或天气条件进一步加剧。先进的机器学习技术可用于从图像中识别杂草。在本文中，我们调查了五个最先进的深神经网络，即VGG16，Reset-50，Inception-V3，Inception-Resnet-V2和MobileNetv2，并评估其杂草识别的性能。我们使用了多种实验设置和多个数据集合组合。特别是，我们通过组合几个较小的数据集，通过数据增强构成了一个大型DataSet，缓解了类别不平衡，并在基于深度神经网络的基准测试中使用此数据集。我们通过保留预先训练的权重来调查使用转移学习技术来利用作物和杂草数据集的图像提取特征和微调它们。我们发现VGG16比小规模数据集更好地执行，而ResET-50比其他大型数据集上的其他深网络更好地执行。

translated by 谷歌翻译

Brain-inspired Cognition in Next Generation Racetrack Memories

Asif Ali Khan , Sebastien Ollivier , Stephen Longofono , Gerald Hempel , Jeronimo Castrillon , Alex K. Jones

分类：机器学习

2021-11-03

超比计算（HDC）是由大脑启发的新出现的计算框架，其在数千个尺寸上运行以模拟认知的载体。与运行数量的传统计算框架不同，HDC，如大脑，使用高维随机向量并能够一次学习。 HDC基于明确定义的算术运算集，并且是高度误差的。 HDC的核心运营操纵高清vectors以散装比特方式，提供许多机会利用并行性。遗憾的是，在传统的von-neuman架构上，处理器中的高清矢量的连续运动可以使认知任务过度缓慢和能量密集。硬件加速器只会略微改进相关的指标。相反，只有使用新兴铭文设备内存的HDC框架的部分实施，已报告了相当大的性能/能源收益。本文介绍了一种基于赛道内存（RTM）的架构，以便在内存中进行和加速整个HDC框架。所提出的解决方案需要最小的附加CMOS电路，并在称为横向读取（TR）的RTM中跨多个域的读取操作，以实现排他性或（XOR）和添加操作。为了最小化CMOS电路的开销，我们提出了一种基于RTM纳米线的计数机制，其利用TR操作和标准RTM操作。使用语言识别作为用例，分别与FPGA设计相比，整体运行时和能耗降低了7.8倍和5.3倍。与最先进的内存实现相比，所提出的HDC系统将能耗降低8.6倍。

translated by 谷歌翻译

Reinforcement Learning based Disease Progression Model for Alzheimer's Disease

Krishnakant V. Saboo , Anirudh Choudhary , Yurui Cao , Gregory A. Worrell , David T. Jones , Ravishankar K. Iyer

分类：机器学习

2021-06-30

通过将微分方程（DES）和强化学习（RL）与域知识相结合，我们模拟阿尔茨海默病的疾病（AD）进展。 DES提供与广告相关的一些但不是全部因素之间的关系。我们假设缺失的关系必须满足关于大脑的工作的一般标准，例如，最大限度地提高认知，同时最小化支持认知的成本。这允许我们通过使用RL来优化捕获捕获上述标准的目标（奖励）函数来提取缺失的关系。我们使用由DES（作为模拟器）和训练的RL代理组成的模型，以预测合成和实际数据的基线（第0年）特征的个性化10年的广告进展。该模型可比较或更好地预测10年的认知轨迹，而不是最先进的基于学习的模型。我们的可解释模型展示，并提供了缓解广告效果的“恢复/补偿”过程的见解，即使这些过程在模型中未明确编码。我们的框架将DES与RL结合起来，以进行广告进展，并具有广泛适用性，以了解其他神经系统疾病。

translated by 谷歌翻译