智能论文笔记

Bounded Future MS-TCN++ for surgical gesture recognition

Adam Goldbraikh , Netanell Avisdris , Carla M. Pugh , Shlomi Laufer

分类：计算机视觉 | 人工智能

2022-09-29

最近，出于手术目的，基于视频的应用程序的发展不断增长。这些应用程序的一部分可以在程序结束后离线工作，其他应用程序必须立即做出反应。但是，在某些情况下，应在过程中进行响应，但可以接受一些延迟。在文献中，已知在线访问性能差距。我们在这项研究中的目标是学习绩效 - 延迟权衡并设计一种基于MS-TCN ++的算法，该算法可以利用这种权衡。为此，我们使用了开放手术模拟数据集，其中包含96个参与者的视频，这些视频在可变的组织模拟器上执行缝合任务。在这项研究中，我们使用了从侧视图捕获的视频数据。对网络进行了训练，以识别执行的手术手势。幼稚的方法是减少MS-TCN ++深度，结果减少了接受场，并且还减少了所需的未来帧数。我们表明该方法是最佳的，主要是在小延迟情况下。第二种方法是限制每个时间卷积中可访问的未来。这样，我们在网络设计方面具有灵活性，因此，与幼稚的方法相比，我们的性能要好得多。

translated by 谷歌翻译

Open surgery tool classification and hand utilization using a multi-camera system

Kristina Basiev , Adam Goldbraikh , Carla M Pugh , Shlomi Laufer

分类：计算机视觉

2021-11-11

目的：这项工作的目标是使用多摄像机视频来分类开放式手术工具，并确定每只手中的哪个工具。多摄像机系统有助于防止在开放的外科视频数据中闭塞。此外，组合多个视图，例如覆盖完整操作场的俯视摄像机和聚焦在手动运动和解剖结构上的特写相机，可以提供更全面的手术工作流程。然而，多摄像机数据融合构成了新的挑战：一个工具可以在一个相机中可见，而不是另一个。因此，我们将全球原始事实定义为使用的工具，无论他们的可见性如何。因此，在系统中应在广泛的时间段内记住超出图像的工具，而系统响应在视频中可见的变化。方法：参与者（n = 48）进行了模拟开放肠道修复。使用顶视图和特写摄像头。 YOLOV5用于工具和手动检测。具有每秒30帧（FPS）的1秒窗口的高频LSTM和3个FPS的40秒窗口的低频LSTM用于空间，时间和多摄像头集成。结果：六个系统的精度和F1是：俯视图（0.88 / 0.88），特写（0.81,0.83），摄像机（0.9 / 0.9），高FPS LSTM（0.92 / 0.93），低FPS LSTM （0.9 / 0.91），我们的最终体系结构多相机分类器（0.93 / 0.94）。结论：通过将具有高FP的系统与多个摄像机阵列的低FPS组合，我们提高了全球地面真理的分类能力。

translated by 谷歌翻译

Video-based fully automatic assessment of open surgery suturing skills

Adam Goldbraikh , Anne-Lise D'Angelo , Carla M. Pugh , Shlomi Laufer

分类：计算机视觉 | 机器学习

2021-10-26

本研究的目标是开发新的可靠开放式手术缝合培训医学院的仿真系统，以便在资源有限或国内设置。即，我们开发了一种工具和手本地化的算法，以及根据简单的网络摄像头视频数据，计算出用于评估外科技能的运动指标。二十五位参与者使用我们的模拟器执行多个缝合任务。 yolo网络已被修改为多任务网络，以便工具本地化和工具手动交互检测。这是通过分割YOLO检测头来实现的，使得它们支持两项任务，以对计算机运行时间最小的添加。此外，基于系统的结果，计算了运动指标。这些指标包括传统的指标，如时间和路径长度以及评估技术参与者使用的新度量来控制工具。双重任务网络性能与两个网络的性能类似，而计算负载仅略大于一个网络。此外，运动指标显示专家和新手之间的显着差异。虽然视频捕获是微创手术的重要组成部分，但它不是开放手术的整体组成部分。因此，需要新的算法，重点关注当前的独特挑战，是开放的手术视频存在。在本研究中，开发了一种双任务网络来解决本地化任务和手动工具交互任务。双网络可以很容易地扩展到多任务网络，这可能对具有多个层的图像有用，并且用于评估这些不同层之间的交互。

translated by 谷歌翻译

Quantum Sparse Coding

Yaniv Romano , Harel Primack , Talya Vaknin , Idan Meirzada , Ilan Karpas , Dov Furman , Chene Tradonsky , Ruti Ben Shlomi

分类： (统计)机器学习

2022-09-08

任何稀疏编码方法的最终目标是从几个嘈杂的线性测量值（一个未知的稀疏向量）中准确恢复。不幸的是，这个估计问题通常是NP-HARD，因此始终采用近似方法（例如Lasso或正交匹配的追踪）来接近它，从而使准确性以较小的计算复杂性进行了交易。在本文中，我们为稀疏编码开发了一种量子启发的算法，前提是，与经典近似方法相比，量子计算机和ISING机器的出现可能会导致更准确的估计。为此，我们将最一般的稀疏编码问题作为二次不受约束的二进制优化（QUBO）任务提出，可以使用量子技术有效地最小化。为了在旋转数量（空间复杂性）方面也有效地得出QUBO模型，我们将分析分为三种不同的情况。这些由表达基础稀疏向量所需的位数来定义：二进制，2位和一般的定点表示。我们使用有关Lightsolver量子启发的数字平台的模拟数据进行数值实验，以验证我们的QUBO公式的正确性，并证明其优于基线方法的优势。

translated by 谷歌翻译

Collective Obfuscation and Crowdsourcing

Benjamin Laufer , Niko A. Grupen

分类：机器学习

2022-08-12

众包技术依靠人群输入可能对决策至关重要的信息。这项工作检查了报告技术的混淆。我们表明，报告平台的广泛使用具有独特的安全性和隐私影响，并引入了威胁模型和相应的分类法，以概述该领域中众多攻击向量中的一些。然后，我们对有争议的现实世界报告热线的呼叫日志数据集进行了经验分析，并确定旨在阻碍平台合法性的协调混淆策略。我们提出了各种统计措施，以量化这种混淆策略在我们数据集中报告攻击的结构和语义特征方面的强度。

translated by 谷歌翻译

Performative Prediction in a Stateful World

Gavin Brown , Shlomi Hod , Iden Kalemaj

分类：机器学习

2020-11-08

部署的监督机器学习模型使预测与世界相互作用。这种现象称为Perdomo等人的表演预测。（ICML 2020）。了解这种预测的影响以及设计工具，是一个持续的挑战，以控制这种影响。我们提出了一种理论框架，其中目标群体对部署分类器的响应被建模为分类器的函数和群体的当前状态（分布）。我们向两次再培训算法的平衡点表示必要和充分的条件，重复风险最小化和Lazier变体。此外，收敛在最佳分类器附近。因此，我们概括了Perdomo等人的结果。，其表现框架不承担任何对目标人群状态的依赖。我们的模型捕获的特定现象是在不同速率下获取信息和资源的独特群体能够响应最新的部署分类器。我们理论上和经验研究这种现象。

translated by 谷歌翻译