智能论文笔记

A Machine Learning Approach for DeepFake Detection

Gustavo Cunha Lacerda , Raimundo Claudio da Silva Vasconcelos

分类：计算机视觉

2022-09-28

随着深层技术的传播，这项技术变得非常易于访问和足够好，以至于对其恶意使用感到担忧。面对这个问题，检测锻造面孔对于确保安全和避免在全球和私人规模上避免社会政治问题至关重要。本文提出了一种使用卷积神经网络检测深击的解决方案，并为此目的开发了一个数据集-celeb -df。结果表明，在这些图像的分类中，总体准确性为95％，提出的模型接近于最新的现状，并且可以调整未来出现的操纵技术的可能性。。

translated by 谷歌翻译

ESTA: An Esports Trajectory and Action Dataset

Peter Xenopoulos , Claudio Silva

分类：机器学习

2022-09-20

体育由于其全球影响力和影响力丰富的预测任务，是部署机器学习模型的令人兴奋的领域。但是，由于其规模，准确性和可访问性，传统运动的数据通常不适合研究使用。为了解决这些问题，我们转向电子竞技，这是一个越来越多的域，它涵盖了类似于传统体育的视频游戏。由于电子竞技数据是通过服务器日志而不是外围传感器获取的，因此电子竞技提供了一个独特的机会来获得大量清洁和详细的时空数据，类似于传统运动中收集的数据。为了解析电子竞技数据，我们开发了AWPY，这是一个开源电子竞技游戏日志解析库，可以从游戏日志中提取玩家轨迹和动作。使用AWPY，我们可以从1,558个游戏日志中解析86万动作，79万游戏帧和417K轨迹，从专业的反击比赛中创建电子竞技轨迹和动作（ESTA）数据集。埃斯塔（ESTA）是迄今为止最大，最颗粒状的公共运动数据集之一。我们使用ESTA来开发基准，以使用特定于玩家的信息进行赢得预测。 ESTA数据可在https://github.com/pnxenopoulos/esta上获得，并且AWPY通过PYPI公开。

translated by 谷歌翻译

Graph Neural Networks to Predict Sports Outcomes

Peter Xenopoulos , Claudio Silva

分类：机器学习

2022-07-28

预测体育运动对球队，联赛，投注者，媒体和球迷来说很重要。鉴于越来越多的播放器跟踪数据，体育分析模型越来越多地利用在播放器跟踪数据上构建的空间衍生功能。但是，由于常见的建模技术依赖于矢量输入，因此不能轻易地将特定于玩家的信息作为功能本身包含。因此，通过空间衍生的特征是根据锚定对象（例如，通过全球功能聚合或通过角色签名方案）构建的，例如，球员在游戏中被指定在游戏中具有独特的作用。在这样做的过程中，我们牺牲了人际关系和地方关系，而是支持全球关系。为了解决这个问题，我们介绍了基于运动的图形表示游戏状态。然后，我们将建议的图表表示作为图形神经网络的输入来预测运动结果。我们的方法可以保留置换不变性，并允许灵活的播放互动权重。我们展示了我们的方法如何为美术和电子竞技的预测任务提供对艺术的统计学显着改善，从而将测试套装损失分别减少了9％和20％。此外，我们展示了如何使用我们的模型来回答运动中的“如果”问题并可视化玩家之间的关系。

translated by 谷歌翻译

Calibrate: Interactive Analysis of Probabilistic Model Output

Peter Xenopoulos , Joao Rulff , Luis Gustavo Nonato , Brian Barr , Claudio Silva

分类：机器学习

2022-07-27

分析分类模型性能对于机器学习从业人员来说是一项至关重要的任务。尽管从业者经常使用从混乱矩阵中得出的基于计数的指标，例如准确性，许多应用程序，例如天气预测，体育博彩或患者风险预测，但依赖分类器的预测概率而不是预测标签。在这些情况下，从业者关注的是产生校准模型，即输出反映真实分布的模型的模型。通常通过静态可靠性图在视觉上分析模型校准，但是，由于所需的强大聚合，传统的校准可视化可能会遭受各种缺陷。此外，基于计数的方法无法充分分析模型校准。我们提出校准，这是一个解决上述问题的交互性可靠性图。校准构造一个可靠性图，该图表可抵抗传统方法中的缺点，并允许进行交互式子组分析和实例级检查。我们通过在现实世界和合成数据上的用例中证明了校准的实用性。我们通过与常规分析模型校准的数据科学家进行思考实验的结果来进一步验证校准。

translated by 谷歌翻译

Towards Global-Scale Crowd+AI Techniques to Map and Assess Sidewalks for People with Disabilities

Maryam Hosseini , Mikey Saugstad , Fabio Miranda , Andres Sevtsuk , Claudio T. Silva , Jon E. Froehlich

分类：计算机视觉

2022-06-28

在世界各地人行道的位置，状况和可访问性上缺乏数据，这不仅会影响人们旅行的何处和方式，而且从根本上限制了交互式映射工具和城市分析。在本文中，我们使用层次多尺度注意模型从卫星图像中构建半自动性的初步工作，从卫星图像中构建人行道网络拓扑模型，从而使用基于学习的基于学习的语义细分从街道级图像从街道图像中推断出表面材料，并评估人行道条件和可访问性。使用人群+AI的功能。我们呼吁创建一个标有卫星和街景场景的数据库，以供人行道和人行道可及性问题以及标准化的基准测试。

translated by 谷歌翻译

A Study on Robustness to Perturbations for Representations of Environmental Sound

Sangeeta Srivastava , Ho-Hsiang Wu , Joao Rulff , Magdalena Fuentes , Mark Cartwright , Claudio Silva , Anish Arora , Juan Pablo Bello

分类：人工智能 | 机器学习

2022-03-20

涉及环境声音分析的音频应用越来越多地使用通用音频表示（也称为嵌入）进行转移学习。最近，对音频表示形式（HEAR）的整体评估评估了关于19个不同任务的29个嵌入模型。但是，评估的有效性取决于给定数据集中已经捕获的变化。因此，对于给定的数据域，尚不清楚表示形式如何受到由无数麦克风范围和声学条件引起的变化的影响 - 通常称为通道效应。我们的目标是扩展听力，以评估不变性以在这项工作中的渠道效果。为此，我们通过向音频信号注入扰动来模仿通道效应，并用三个距离测量方法测量新（扰动）嵌入的变化，从而使评估域依赖但不依赖于任务依赖性。结合下游性能，它有助于我们对嵌入方式对频道效果的鲁棒性进行更明智的预测。我们评估了两个嵌入 - Yamnet和OpenL3在单声道（Urbansound8K）和多音（Sonyc-ust）Urban数据集上。我们表明，在这种无关的评估中，一个距离度量不足。尽管FR \'Echet音频距离（FAD）与下游任务中的性能下降趋势相关，但我们表明我们需要与其他距离一起研究时尚，以清楚地了解对该时尚的整体效果扰动。就嵌入性能而言，我们发现OpenL3比Yamnet更强大，Yamnet与听觉评估保持一致。

translated by 谷歌翻译

Gait Recognition Based on Deep Learning: A Survey

Claudio Filipi Gonçalves dos Santos , Diego de Souza Oliveira , Leandro A. Passos , Rafael Gonçalves Pires , Daniel Felipe Silva Santos , Lucas Pascotti Valem , Thierry P. Moreira , Marcos Cleison S. Santana , Mateus Roder , João Paulo Papa

分类：计算机视觉 | 机器学习

2022-01-10

通常，基于生物谱系的控制系统可能不依赖于各个预期行为或合作适当运行。相反，这种系统应该了解未经授权的访问尝试的恶意程序。文献中提供的一些作品建议通过步态识别方法来解决问题。这些方法旨在通过内在的可察觉功能来识别人类，尽管穿着衣服或配件。虽然该问题表示相对长时间的挑战，但是为处理问题的大多数技术存在与特征提取和低分类率相关的几个缺点，以及其他问题。然而，最近的深度学习方法是一种强大的一组工具，可以处理几乎任何图像和计算机视觉相关问题，为步态识别提供最重要的结果。因此，这项工作提供了通过步态认可的关于生物识别检测的最近作品的调查汇编，重点是深入学习方法，强调他们的益处，暴露出弱点。此外，它还呈现用于解决相关约束的数据集，方法和体系结构的分类和表征描述。

translated by 谷歌翻译

CitySurfaces: City-Scale Semantic Segmentation of Sidewalk Materials

Maryam Hosseini , Fabio Miranda , Jianzhe Lin , Claudio Silva

分类：计算机视觉

2022-01-06

在设计可持续和弹性的城市建造环境的同时，越来越多地促进了世界各地的，重大的数据差距对压迫可持续性问题挑战开展的研究。已知人行道具有强大的经济和环境影响;然而，由于数据收集的成本持久和耗时的性质，大多数城市缺乏它们的表面的空间目录。计算机愿景的最新进展与街道级别图像的可用性一起为城市提供了新的机会，以利用较低的实施成本和更高的准确性提取大规模建筑环境数据。在本文中，我们提出了一个基于主动学习的框架，利用计算机视觉技术来使用广泛可用的街道图像进行分类的计算机视觉技术。我们培训了来自纽约市和波士顿的图像的框架，评价结果显示了90.5％的Miou评分。此外，我们使用六个不同城市的图像评估框架，表明它可以应用于具有不同城市面料的区域，即使在培训数据的领域之外。 Citysurfaces可以为研究人员和城市代理商提供低成本，准确，可扩展的方法来收集人行道材料数据，在寻求主要可持续性问题方面发挥着关键作用，包括气候变化和地表水管理。

translated by 谷歌翻译

Topological Representations of Local Explanations

Peter Xenopoulos , Gromit Chan , Harish Doraiswamy , Luis Gustavo Nonato , Brian Barr , Claudio Silva

分类：机器学习

2022-01-06

本地解释性方法 - 由于需要从业者将其模型输出合理化，因此寻求为每次预测产生解释的人越来越普遍。然而，比较本地解释性方法很难，因为它们每个都会在各种尺度和尺寸中产生输出。此外，由于一些可解释性方法的随机性质，可以不同地运行方法以产生给定观察的矛盾解释。在本文中，我们提出了一种基于拓扑的框架来从一组本地解释中提取简化的表示。我们通过首先为标量函数设计解释空间和模型预测之间的关系来实现。然后，我们计算这个功能的拓扑骨架。这种拓扑骨架作为这样的功能的签名，我们用于比较不同的解释方法。我们证明我们的框架不仅可以可靠地识别可解释性技术之间的差异，而且提供稳定的表示。然后，我们展示了我们的框架如何用于标识本地解释性方法的适当参数。我们的框架很简单，不需要复杂的优化，并且可以广泛应用于大多数本地解释方法。我们认为，我们的方法的实用性和多功能性将有助于促进基于拓扑的方法作为理解和比较解释方法的工具。

translated by 谷歌翻译

Sidewalk Measurements from Satellite Images: Preliminary Findings

Maryam Hosseini , Iago B. Araujo , Hamed Yazdanpanah , Eric K. Tokuda , Fabio Miranda , Claudio T. Silva , Roberto M. Cesar Jr

分类：计算机视觉

2021-12-12

对行人基础设施，特别是人行道的大规模分析对人类以人为本的城市规划和设计至关重要。受益于通过纽约市开放数据门户提供的Procepetric特征和高分辨率OrthoImages的丰富数据集，我们培养计算机视觉模型来检测遥感图像的人行道，道路和建筑物，达到83％的Miou持有-out测试集。我们应用形状分析技术来研究提取的人行道的不同属性。更具体地，我们对人行道的宽度，角度和曲率进行了瓷砖明智的分析，除了它们对城市地区的可行性和可达性的一般影响，众所周知，在轮椅用户的移动性中具有重要作用。初步结果是有前途的，瞥见了不同城市采用的拟议方法的潜力，使研究人员和从业者可以获得更生动的行人领域的画面。

translated by 谷歌翻译