智能论文笔记

Real-time Informative Surgical Skill Assessment with Gaussian Process Learning

Yangming Li , Randall Bly , Sarah Akkina , Rajeev C. Saxena , Ian Humphreys , Mark Whipple , Kris Moe , Blake Hannaford

分类：机器学习

2021-12-05

内镜窦和头骨基础手术（Essbss）是一个具有挑战性和潜在的危险的外科手术，客观技能评估是提高手术训练有效性的关键组成部分，重新验证外科医生的技能，并降低手术创伤和并发症手术室的速度。由于外科手术的复杂性，操作风格的变化，以及新的外科技能的快速发展，外科技能评估仍然是一个具有挑战性的问题。这项工作提出了一种新颖的高斯过程学习的启发式自动客观外科手术技能评估方法。不同于经典的外科技能评估算法，所提出的方法1）利用外科仪器相对运动中的运动学特征，而不是使用特定的外科任务或统计数据实时评估技能; 2）提供信息丰富的反馈，而不是总结分数; 3）能够逐步从新数据逐步学习，而不是根据固定的数据集。该方法将仪器运动投射到内窥镜坐标中以减少数据维度。然后，它提取投影数据的运动学特征，并学习外科技能水平与高斯过程学习技术的特征之间的关系。该方法在全内镜颅底和尸体上的鼻窦手术中核实。这些手术具有不同的病理学，需要不同的治疗并具有不同的复杂性。实验结果表明，该方法达到了100 \％的预测精度，用于完整的外科手术和90 \％的实时预测评估精度。

translated by 谷歌翻译

Real-time Virtual Intraoperative CT for Image Guided Surgery

Yangming Li , Neeraja Konuthula , Ian M. Humphreys , Kris Moe , Blake Hannaford , Randall Bly

分类：计算机视觉 | 机器学习 | 机器人

2021-12-05

抽象的。目的：本文提出了一种用于产生虚拟术中CT扫描的方案，以改善内窥镜窦手术（ESS）的手术完整性。方法：该工作呈现三种方法，基于尖端运动，基于尖端轨迹的基于仪器，以及基于仪器，以及虚拟术中CT生成的非参数平滑和高斯过程回归。结果：所提出的方法研究，并在尸体上进行的ESS进行了比较。外科结果表明，所有三种方法都改善了骰子相似系数> 86％，F分数> 92％和精度> 89.91％。发现基于尖端轨迹的方法具有最佳性能，并在外科完整性评估中获得了96.87％的精度。结论：这项工作表明，虚拟术中CT扫描改善了实际手术场景与参考模型之间的一致性，并提高了ESS中的手术完整性。与实际的术中CT扫描相比，该方案对现有的外科议定书没有影响，不需要除了最多的ESS中已经提供的额外硬件克服了高成本，重复辐射和由实际术中引起的细长麻醉CTS，并在ESS中实用。

translated by 谷歌翻译

Video-based Surgical Skills Assessment using Long term Tool Tracking

Mona Fathollahi , Mohammad Hasan Sarhan , Ramon Pena , Lela DiMonte , Anshu Gupta , Aishani Ataliwala , Jocelyn Barker

分类：计算机视觉

2022-07-05

掌握进行手术所需的技术技能是一项极具挑战性的任务。基于视频的评估使外科医生可以收到有关其技术技能的反馈，以促进学习和发展。目前，此反馈主要来自手动视频评论，该视频审查是耗时的，限制了在许多情况下跟踪外科医生进展的可行性。在这项工作中，我们引入了一种基于运动的方法，以自动评估手术病例视频饲料的手术技能。拟议的管道首先可靠地轨道轨迹，以创建运动轨迹，然后使用这些轨迹来预测外科医生的技术技能水平。跟踪算法采用了一个简单而有效的重新识别模块，与其他最新方法相比，它可以改善ID-开关。这对于创建可靠的工具轨迹至关重要，当仪器定期在屏幕上和屏幕外移动或定期遮盖。基于运动的分类模型采用最先进的自我发明变压器网络来捕获对技能评估至关重要的短期和长期运动模式。在体内（Cholec80）数据集上评估了所提出的方法，其中专家评级的目标技能评估对Calot三角解剖的评估被用作定量技能度量。我们将基于变压器的技能评估与传统的机器学习方法进行比较，并使用拟议的和最新的跟踪方法进行比较。我们的结果表明，使用可靠跟踪方法的运动轨迹对仅根据视频流进行评估的外科医生技能是有益的。

translated by 谷歌翻译

Analysis of Executional and Procedural Errors in Dry-lab Robotic Surgery Experiments

Kay Hutchinson , Zongyu Li , Leigh A. Cantrell , Noah S. Schenkman , Homa Alemzadeh

分类：机器人

2021-06-22

背景技术分析运动和视频数据可以帮助识别可能的错误动作，导致机器人辅助手术中的次优外科医生性能和安全关键事件。方法开发针对识别任务和手势的刽子手和程序错误的标题，并评估从拼图数据集中缝合和针传递任务的干燥实验室演示。我们通过标记视频数据来表征示范的错误部分，以及在运动数据上使用分发相似性分析和轨迹平均来识别区分错误手势的参数。结果刽子手误差频率因任务和手势而异，与技能水平相关。每个手势中的一些主要误差模式通过分析特定误差的运动参数来区分。程序错误可能导致性能分数降低，并增加了演示时间，但也取决于手术方式。结论本研究提供了对依赖于上下文错误的见解，这些错误可用于设计自动化错误检测机制并改善培训和技能评估。

translated by 谷歌翻译

Video-based fully automatic assessment of open surgery suturing skills

Adam Goldbraikh , Anne-Lise D'Angelo , Carla M. Pugh , Shlomi Laufer

分类：计算机视觉 | 机器学习

2021-10-26

本研究的目标是开发新的可靠开放式手术缝合培训医学院的仿真系统，以便在资源有限或国内设置。即，我们开发了一种工具和手本地化的算法，以及根据简单的网络摄像头视频数据，计算出用于评估外科技能的运动指标。二十五位参与者使用我们的模拟器执行多个缝合任务。 yolo网络已被修改为多任务网络，以便工具本地化和工具手动交互检测。这是通过分割YOLO检测头来实现的，使得它们支持两项任务，以对计算机运行时间最小的添加。此外，基于系统的结果，计算了运动指标。这些指标包括传统的指标，如时间和路径长度以及评估技术参与者使用的新度量来控制工具。双重任务网络性能与两个网络的性能类似，而计算负载仅略大于一个网络。此外，运动指标显示专家和新手之间的显着差异。虽然视频捕获是微创手术的重要组成部分，但它不是开放手术的整体组成部分。因此，需要新的算法，重点关注当前的独特挑战，是开放的手术视频存在。在本研究中，开发了一种双任务网络来解决本地化任务和手动工具交互任务。双网络可以很容易地扩展到多任务网络，这可能对具有多个层的图像有用，并且用于评估这些不同层之间的交互。

translated by 谷歌翻译

The HoloLens in Medicine: A systematic Review and Taxonomy

Christina Gsaxner , Jianning Li , Antonio Pepe , Yuan Jin , Jens Kleesiek , Dieter Schmalstieg , Jan Egger

分类：计算机视觉

2022-09-06

Hololens（Microsoft Corp.，WA Redmond，WA）是一款头饰，光学透明的增强现实展示，是最近提高医学增强现实研究的主要参与者。在医疗环境中，HoloLens使医生能够立即了解患者信息，直接与他们对临床方案的看法，医学生，可以更好地了解复杂的解剖学或程序，甚至可以通过执行治疗任务。改进，沉浸式指导。在这篇系统的综述中，我们提供了有关医疗领域第一代霍洛伦斯在2016年3月发布到2021年的全面使用的全面概述，一直关注其继任者霍洛伦斯2号。通过系统搜索PubMed和Scopus数据库确定了171个相关出版物。我们分析了这些出版物的预期用例，注册和跟踪的技术方法，数据源，可视化以及验证和评估。我们发现，尽管已经显示出在各种医学场景中使用Hololens的可行性，但在精确，可靠性，可用性，工作流程和感知方面的努力增加了在临床实践中建立AR。

translated by 谷歌翻译

A Multi-Sensor Interface to Improve the Learning Experience in Arc Welding Training Tasks

Hoi-Yin Lee , Peng Zhou , Anqing Duan , Jiangliu Wang , Victor Wu , David Navarro-Alarcon

分类：机器人

2021-09-03

本文介绍了多传感器用户界面的开发，以促进电弧焊接任务的指导。获得手眼协调能力的传统方法通常是通过一对一的指导来进行的，学员必须戴着保护头盔并进行多项测试。这种方法效率低下，因为电弧从电弧发出的有害光阻止了对过程的密切监测。从业者只能观察到一个小的亮点。为了解决这些问题，最近的培训方法利用虚拟现实来安全地模拟该过程并可视化工件的几何形状。但是，这些类型的仿真平台的合成性质降低了它们的有效性，因为它们无法构成与环境的实际焊接相互作用，从而阻碍了受训者的学习过程。为了为用户提供真正的焊接体验，我们开发了一个新的多传感器扩展现实平台，用于弧焊接训练。我们的系统由：（1）HDR摄像头，实时监视真实的焊接位；（2）深度传感器，捕获场景的3D几何形状；（3）头部安装的VR显示屏，可以安全地可视化过程。我们的创新平台为用户提供了“机器人培训师”，接缝几何形状的虚拟提示，自动点跟踪和性能得分。为了验证平台的可行性，我们通过几项焊接培训任务进行了广泛的实验。我们表明，与传统的培训实践和最近的虚拟现实方法相比，我们的自动多传感器方法在准确性，学习曲线和有效性方面取得了更好的性能。

translated by 谷歌翻译

Roadmap on Signal Processing for Next Generation Measurement Systems

D. K. Iakovidis , M. Ooi , Y. C. Kuang , S. Damidenko , A. Shestakov , V. Sinistin , M. Henry , A. Sciacchitano , A. Discetti , S. Donati

分类：人工智能 | 计算机视觉

2021-11-03

信号处理是几乎任何传感器系统的基本组件，具有不同科学学科的广泛应用。时间序列数据，图像和视频序列包括可以增强和分析信息提取和量化的代表性形式的信号。人工智能和机器学习的最近进步正在转向智能，数据驱动，信号处理的研究。该路线图呈现了最先进的方法和应用程序的关键概述，旨在突出未来的挑战和对下一代测量系统的研究机会。它涵盖了广泛的主题，从基础到工业研究，以简明的主题部分组织，反映了每个研究领域的当前和未来发展的趋势和影响。此外，它为研究人员和资助机构提供了识别新前景的指导。

translated by 谷歌翻译

A real-time spatiotemporal AI model analyzes skill in open surgical videos

Emmett D. Goodman , Krishna K. Patel , Yilun Zhang , William Locke , Chris J. Kennedy , Rohan Mehrotra , Stephen Ren , Melody Guan , Maren Downing , Hao Wei Chen

分类：计算机视觉 | 人工智能

2021-12-14

开放程序代表全球手术的主要形式。人工智能（AI）有可能优化手术实践并改善患者结果，但努力主要集中在微创技术上。我们的工作通过策划，从YouTube，从YouTube，Open Surgical视频的最大数据集克服了培训AI模型的现有数据限制：1997年从50个国家上传的23个外科手术的视频。使用此数据集，我们开发了一种能够实时了解外科行为，手和工具的多任务AI模型 - 程序流程和外科医生技能的构建块。我们表明我们的模型推广了各种外科类型和环境。说明这种普遍性，我们直接应用了YouTube培训的模型，分析了在学术医疗中心前瞻性收集的开放式手术，并确定了与手动效率相关的外科技能的运动学描述符。我们的开放外科（AVOS）数据集和培训模式的注释视频将可用于进一步发展外科艾。

translated by 谷歌翻译

Automated Systems For Diagnosis of Dysgraphia in Children: A Survey and Novel Framework

Jayakanth Kunhoth , Somaya Al-Maadeed , Suchithra Kunhoth , Younus Akbari

分类：机器学习 | 人工智能 | 计算机视觉

2022-06-27

众所周知，学习障碍主要干扰阅读，写作和数学等基本学习技能，会影响世界上约10％的儿童。作为神经发育障碍的一部分的运动技能和运动协调不足可能成为学习写作困难（障碍）的原因因素，从而阻碍了个人的学术轨道。障碍症的体征和症状包括但不限于不规则的笔迹，不正确的写作媒介处理，缓慢或劳力的写作，不寻常的手部位等。所有类型的学习障碍的评估标准是由医学医学进行的检查专家。少数可用的人工智能筛查系统用于障碍症，依赖于相应图像中手写的独特特征。这项工作对文献中儿童的现有自动化障碍诊断系统进行了综述。这项工作的主要重点是审查基于人工智能的儿童诊断的基于人工智能的系统。这项工作讨论了数据收集方法，重要的手写功能，用于诊断障碍症的文献中使用的机器学习算法。除此之外，本文还讨论了一些基于非人工智能的自动化系统。此外，本文讨论了现有系统的缺点，并提出了一个新颖的障碍诊断框架。

translated by 谷歌翻译

STTAR: Surgical Tool Tracking using off-the-shelf Augmented Reality Head-Mounted Displays

Alejandro Martin-Gomez , Haowei Li , Tianyu Song , Sheng Yang , Guangzhi Wang , Hui Ding , Nassir Navab , Zhe Zhao , Mehran Armand

分类：机器人

2022-08-17

使用增强现实（AR）用于导航目的，这表明在手术手术过程中协助医生有益。这些应用通常需要知道外科手术工具和患者的姿势，以提供外科医生在任务执行过程中可以使用的视觉信息。现有的医学级跟踪系统使用放置在手术室内的红外摄像头（OR）来识别感兴趣的对象附加并计算其姿势的复古反射标记。一些市售的AR头式显示器（HMD）使用类似的摄像头进行自定位，手动跟踪和估算对象的深度。这项工作提出了一个使用AR HMD的内置摄像机来准确跟踪复古反射标记的框架，例如在手术过程中使用的标记，而无需集成任何其他组件。该框架还能够同时跟踪多个工具。我们的结果表明，横向翻译的准确度为0.09 +-0.06毫米，可以实现标记的跟踪和检测，纵向翻译的0.42 +-0.32 mm，绕垂直轴旋转的0.80 +-0.39 ver。此外，为了展示所提出的框架的相关性，我们在手术程序的背景下评估了系统的性能。该用例旨在在骨科过程中复制K-Wire插入的场景。为了进行评估，为两名外科医生和一名生物医学研究人员提供了视觉导航，每次都进行了21次注射。该用例的结果提供了与基于AR的导航程序报告的相当精度。

translated by 谷歌翻译

Task Dynamics of Prior Training Influence Visual Force Estimation Ability During Teleoperation

Zonghe Chua , Anthony M. Jarc , Sherry Wren , Ilana Nisky , Allison M. Okamura

分类：机器人

2020-04-28

机器人辅助的微创手术（RMI）缺乏触觉反馈是在手术过程中安全组织处理的潜在障碍。贝叶斯建模理论表明，与没有经验的外科医生相比，在RMIS期间，具有开放或腹腔镜手术经验的外科医生可以发展为组织刚度的先验。为了测试先前的触觉经验是否导致远程操作的力估计能力提高，将33名参与者分配到三个训练条件之一：手动操纵，用力反馈的远程操作或无力反馈的远程操作，并学会了将硅胶样品张紧到一套力值。然后，他们被要求执行张力任务，以及先前未经触觉的任务，而无需反馈而在远程操作下进行不同的力量值。与远程操作组相比，手动组在训练的力量范围之外的张力任务中具有较高的力误差，但在低力水平下，在触诊任务中显示出更好的速度准确性功能。这表明训练方式的动力学会影响远程操作过程中的力估计能力，如果在与任务相同的动态下形成，则可以访问先前的触觉体验。

translated by 谷歌翻译

Predicting the Timing of Camera Movements From the Kinematics of Instruments in Robotic-Assisted Surgery Using Artificial Neural Networks

Hanna Kossowsky , Ilana Nisky

分类：机器学习 | 计算机视觉 | 机器人

2021-09-23

机器人辅助的手术辅助外科医生和患者，但外科医生经常需要调整内窥镜摄像头以实现良好的观点。同时控制相机和外科手术器械是不可能的，因此，这些相机调整反复中断手术。自主摄像机控制可以帮助克服这一挑战，但大多数现有系统都是反应性的，例如，通过使相机遵循外科手术器械。当使用人工神经网络发生相机运动时，我们提出了一种预测的方法，以期待相机运动。我们使用了手术器械的运动学数据，这些数据在猪模型的机器人辅助手术训练中记录。我们将数据拆分为段，并将其标记为立即在相机移动之前的段，或者段。由于阶级的不平衡庞大，我们培训了一个网络的集合，每个网络都在训练数据的平衡子集上。我们发现仪器的运动学数据可用于预测当发生相机运动时，并在不同段持续时间和合奏尺寸上进行评估。我们还研究了预测即将到来的相机运动的提前多少，并且发现预测相机运动0.25,0.5和1秒，在它们发生的情况下实现98％，94％和84％的精度相对于迫在眉睫的预测相机运动。这表明可以早期预测相机运动事件以留出计算和执行自主摄像机运动的时间，并表明可以有一天可以是可行的RAMIS的自主摄像机控制器。

translated by 谷歌翻译

Active Multi-Object Exploration and Recognition via Tactile Whiskers

Chenxi Xiao , Shujia Xu , Wenzhuo Wu , Juan Wachs

分类：机器人

2021-09-08

当没有光学信息可用时，在不确定环境下的机器人探索具有挑战性。在本文中，我们提出了一种自主解决方案，即仅基于触觉感测，探索一个未知的任务空间。我们首先根据MEMS晴雨表设备设计了晶须传感器。该传感器可以通过非侵入性与环境进行交互来获取联系信息。该传感器伴随着一种计划技术，可以通过使用触觉感知来产生探索轨迹。该技术依赖于触觉探索的混合政策，其中包括用于对象搜索的主动信息路径计划，以及用于轮廓跟踪的反应性HOPF振荡器。结果表明，混合勘探政策可以提高对象发现的效率。最后，通过细分对象和分类来促进场景的理解。开发了一个分类器，以根据晶须传感器收集的几何特征识别对象类别。这种方法证明了晶须传感器以及触觉智能，可以提供足够的判别特征来区分对象。

translated by 谷歌翻译

Integrating Deep Learning and Augmented Reality to Enhance Situational Awareness in Firefighting Environments

Manish Bhattarai

分类：计算机视觉

2021-07-23

我们提出了一种新的四管齐下的方法，在文献中首次建立消防员的情境意识。我们构建了一系列深度学习框架，彼此之叠，以提高消防员在紧急首次响应设置中进行的救援任务的安全性，效率和成功完成。首先，我们使用深度卷积神经网络（CNN）系统，以实时地分类和识别来自热图像的感兴趣对象。接下来，我们将此CNN框架扩展了对象检测，跟踪，分割与掩码RCNN框架，以及具有多模级自然语言处理（NLP）框架的场景描述。第三，我们建立了一个深入的Q学习的代理，免受压力引起的迷失方向和焦虑，能够根据现场消防环境中观察和存储的事实来制定明确的导航决策。最后，我们使用了一种低计算无监督的学习技术，称为张量分解，在实时对异常检测进行有意义的特征提取。通过这些临时深度学习结构，我们建立了人工智能系统的骨干，用于消防员的情境意识。要将设计的系统带入消防员的使用，我们设计了一种物理结构，其中处理后的结果被用作创建增强现实的投入，这是一个能够建议他们所在地的消防员和周围的关键特征，这对救援操作至关重要在手头，以及路径规划功能，充当虚拟指南，以帮助迷彩的第一个响应者恢复安全。当组合时，这四种方法呈现了一种新颖的信息理解，转移和综合方法，这可能会大大提高消防员响应和功效，并降低寿命损失。

translated by 谷歌翻译

Metaverse for Healthcare: A Survey on Potential Applications, Challenges and Future Directions

Rajeswari Chengoden , Nancy Victor , Thien Huynh-The , Gokul Yenduri , Rutvij H. Jhaveri , Mamoun Alazab , Sweta Bhattacharya , Pawan Hegde , Praveen Kumar Reddy Maddikunta , Thippa Reddy Gadekallu

分类：人工智能

2022-09-09

数字化和自动化方面的快速进步导致医疗保健的加速增长，从而产生了新型模型，这些模型正在创造新的渠道，以降低成本。 Metaverse是一项在数字空间中的新兴技术，在医疗保健方面具有巨大的潜力，为患者和医生带来了现实的经验。荟萃分析是多种促成技术的汇合，例如人工智能，虚拟现实，增强现实，医疗设备，机器人技术，量子计算等。通过哪些方向可以探索提供优质医疗保健治疗和服务的新方向。这些技术的合并确保了身临其境，亲密和个性化的患者护理。它还提供自适应智能解决方案，以消除医疗保健提供者和接收器之间的障碍。本文对医疗保健的荟萃分析提供了全面的综述，强调了最新技术的状态，即采用医疗保健元元的能力技术，潜在的应用程序和相关项目。还确定了用于医疗保健应用的元元改编的问题，并强调了合理的解决方案作为未来研究方向的一部分。

translated by 谷歌翻译

When Bioprocess Engineering Meets Machine Learning: A Survey from the Perspective of Automated Bioprocess Development

Nghia Duong-Trung , Stefan Born , Jong Woo Kim , Marie-Therese Schermeyer , Katharina Paulick , Maxim Borisyak , Ernesto Martinez , Mariano Nicolas Cruz-Bournazou , Thorben Werner , Randolf Scholz

分类：机器学习

2022-09-02

机器学习（ML）为生物处理工程的发展做出了重大贡献，但其应用仍然有限，阻碍了生物过程自动化的巨大潜力。用于模型构建自动化的ML可以看作是引入另一种抽象水平的一种方式，将专家的人类集中在生物过程开发的最认知任务中。首先，概率编程用于预测模型的自动构建。其次，机器学习会通过计划实验来测试假设并进行调查以收集信息性数据来自动评估替代决策，以收集基于模型预测不确定性的模型选择的信息数据。这篇评论提供了有关生物处理开发中基于ML的自动化的全面概述。一方面，生物技术和生物工程社区应意识到现有ML解决方案在生物技术和生物制药中的应用的限制。另一方面，必须确定缺失的链接，以使ML和人工智能（AI）解决方案轻松实施在有价值的生物社区解决方案中。我们总结了几个重要的生物处理系统的ML实施，并提出了两个至关重要的挑战，这些挑战仍然是生物技术自动化的瓶颈，并减少了生物技术开发的不确定性。没有一个合适的程序；但是，这项综述应有助于确定结合生物技术和ML领域的潜在自动化。

translated by 谷歌翻译

HTML版本

Motion Planning in Dynamic Environments Using Context-Aware Human Trajectory Prediction

Mark Nicholas Finean , Luka Petrović , Wolfgang Merkt , Ivan Marković , Ioannis Havoutis

分类：机器人

2022-01-13

多年来，运动规划，映射和人类轨迹预测的单独领域显着提出。然而，在提供能够使移动操纵器能够执行全身运动并考虑移动障碍物的预测运动时，文献在提供实际框架方面仍然稀疏。基于以前的优化的运动计划方法，使用距离字段遭受更新环境表示所需的高计算成本。我们证明，与从头划痕计算距离场相比，GPU加速预测的复合距离场显着降低计算时间。我们将该技术与完整的运动规划和感知框架集成，其占据动态环境中的人类的预测运动，从而实现了包含预测动作的反应性和先发制人的运动规划。为实现这一目标，我们提出并实施了一种新颖的人类轨迹预测方法，该方法结合了基于轨迹优化的运动规划的意图识别。我们在现实世界丰田人类支持机器人（HSR）上验证了我们的由Onboard Camera的现场RGB-D传感器数据验证了我们的结果框架。除了在公开的数据集提供分析外，我们还释放了牛津室内人类运动（牛津-IHM）数据集，并在人类轨迹预测中展示了最先进的性能。牛津-IHM数据集是一个人类轨迹预测数据集，人们在室内环境中的兴趣区域之间行走。静态和机器人安装的RGB-D相机都观察了用运动捕获系统跟踪的人员。

translated by 谷歌翻译

Robotic Endoscope Control via Autonomous Instrument Tracking

Caspar Gruijthuijsen , Luis C. Garcia-Peraza-Herrera , Gianni Borghesan , Dominiek Reynaerts , Jan Deprest , Sebastien Ourselin , Tom Vercauteren , Emmanuel Vander Poorten

分类：机器人

2021-07-05

许多钥匙孔干预依赖于双手动处理外科手术器械，强迫主要外科医生依靠第二个外科医生作为相机助理。除了过度涉及手术人员的负担外，这可能导致图像稳定性降低，增加任务完成时间，有时由于任务的单调而有时会出现错误。由一组基本说明控制的机器人内窥镜持有者已被提出作为替代方案，但它们的不自然处理可能会增加（SOLO）外科医生的认知负荷，这阻碍了它们的临床验收。如果机器人内窥镜持有者通过语义上丰富的指令与操作外科医生合作的机器人内窥镜持有者，则可以实现手术工作流程的更无缝集成。作为概念证明，本文介绍了一种新颖的系统，为外科医生和机器人内窥镜支架之间的协同相互作用铺平了道路。该拟议的平台允许外科医生执行生理协调和导航任务，而机器人臂自动执行内窥镜定位任务。在我们的系统中，我们提出了一种基于外科刀具分割的新型工具提示定位方法和一种新型的视觉伺服方法，可确保内窥镜摄像机的平滑和适当的运动。我们验证了我们的视觉管道并运行了对该系统的用户学习。通过使用欧洲妇科手术课程验证的腹腔镜运动来确保研究的临床相关性，涉及双部手动协调和导航。我们拟议的系统的成功应用提供了更广泛的临床采用机器人内窥镜架的有希望的起点。

translated by 谷歌翻译

Automatic Gaze Analysis: A Survey of Deep Learning based Approaches

Shreya Ghosh , Abhinav Dhall , Munawar Hayat , Jarrod Knibbe , Qiang Ji

分类：计算机视觉

2021-08-12

眼目光分析是计算机视觉和人类计算机相互作用领域的重要研究问题。即使在过去十年中取得了显着进展，由于眼睛外观，眼头相互作用，遮挡，图像质量和照明条件的独特性，自动凝视分析仍然具有挑战性。有几个开放的问题，包括在没有先验知识的情况下，在不受限制的环境中解释凝视方向的重要提示以及如何实时编码它们。我们回顾了一系列目光分析任务和应用程序的进展，以阐明这些基本问题，确定凝视分析中的有效方法并提供可能的未来方向。我们根据其优势和报告的评估指标分析了最近的凝视估计和分割方法，尤其是在无监督和弱监督的领域中。我们的分析表明，强大而通用的凝视分析方法的开发仍然需要解决现实世界中的挑战，例如不受限制的设置和学习，并减少了监督。最后，我们讨论了设计现实的目光分析系统的未来研究方向，该系统可以传播到其他领域，包括计算机视觉，增强现实（AR），虚拟现实（VR）和人类计算机交互（HCI）。项目页面：https：//github.com/i-am-shreya/eyegazesurvey} {https://github.com/i-am-shreya/eyegazesurvey

translated by 谷歌翻译