智能论文笔记

Data Augmented 3D Semantic Scene Completion with 2D Segmentation Priors

Aloisio Dourado , Frederico Guth , Teofilo de Campos

分类：计算机视觉 | 人工智能

2021-11-26

语义场景完成（SSC）是一个具有挑战性的计算机视觉任务，具有许多实际应用，从机器人到辅助计算。其目标是在场景的视野中推断3D几何图形和体素的语义标记，包括遮挡区域。在这项工作中，我们呈现出来，一种新型轻质多模式3D深CNN，其与来自BiMoDal 2D分段网络的语义前沿的RGB-D图像的深度分量无缝地熔化结构数据。这一领域的一个至关重要的困难是缺乏完全标记的现实世界3D数据集，足以训练当前的数据饥饿的深3d CNN。在2D计算机愿景任务中，已提出许多数据增强策略来改善CNN的泛化能力。但是，这些方法不能直接应用于RGB-D输入和SSC解决方案的输出量。在本文中，我们介绍了可以应用于多模式SSC网络的3D数据增强策略的使用。我们通过全面和可重复的消融研究验证我们的贡献。我们的解决方案始终如一地超越了以前的作品，具有类似的复杂程度。

translated by 谷歌翻译

Embedding generation for text classification of Brazilian Portuguese user reviews: from bag-of-words to transformers

Frederico Dias Souza , João Baptista de Oliveira e Souza Filho

分类：自然语言处理 | 人工智能

2022-12-01

Text classification is a natural language processing (NLP) task relevant to many commercial applications, like e-commerce and customer service. Naturally, classifying such excerpts accurately often represents a challenge, due to intrinsic language aspects, like irony and nuance. To accomplish this task, one must provide a robust numerical representation for documents, a process known as embedding. Embedding represents a key NLP field nowadays, having faced a significant advance in the last decade, especially after the introduction of the word-to-vector concept and the popularization of Deep Learning models for solving NLP tasks, including Convolutional Neural Networks (CNNs), Recurrent Neural Networks (RNNs), and Transformer-based Language Models (TLMs). Despite the impressive achievements in this field, the literature coverage regarding generating embeddings for Brazilian Portuguese texts is scarce, especially when considering commercial user reviews. Therefore, this work aims to provide a comprehensive experimental study of embedding approaches targeting a binary sentiment classification of user reviews in Brazilian Portuguese. This study includes from classical (Bag-of-Words) to state-of-the-art (Transformer-based) NLP models. The methods are evaluated with five open-source databases with pre-defined data partitions made available in an open digital repository to encourage reproducibility. The Fine-tuned TLMs achieved the best results for all cases, being followed by the Feature-based TLM, LSTM, and CNN, with alternate ranks, depending on the database under analysis.

translated by 谷歌翻译

Wavelet Score-Based Generative Modeling

Florentin Guth , Simon Coste , Valentin De Bortoli , Stephane Mallat

分类：机器学习 | 计算机视觉 | (统计)机器学习

2022-08-09

基于得分的生成模型（SGM）通过运行时间转移的随机微分方程（SDE）从高斯白噪声中合成新数据样本，其漂移系数取决于某些概率分数。此类SDE的离散化通常需要大量的时间步骤，因此需要高计算成本。这是因为我们通过数学分析的分数的不良条件特性。我们表明，通过将数据分布分配到跨尺度的小波系数的条件概率的产物中，可以将SGMS大大加速。最终的小波得分生成模型（WSGM）在所有尺度上都以相同的时间步长合成小波系数，因此其时间复杂性随着图像大小而线性增长。这在数学上是在高斯分布上证明的，并在相变和自然图像数据集中的物理过程上以数值显示。

translated by 谷歌翻译

Dynamic Modeling of Branched Robots using Modular Composition

Frederico Fernandes Afonso Silva , Bruno Vilhena Adorno

分类：机器人

2022-08-03

这封信提出了一个系统的模块化过程，用于组成几个子系统的分支机器人的动态建模，每个系统由多个刚体组成。此外，即使某些子系统被视为黑匣子，提出的策略也适用，仅需要在不同子系统之间的连接点上的曲折和扳手。为了帮助模型组成，我们还提出了一个图表表示，该图表编码子系统之间的曲折和扳手的传播。数值结果表明，所提出的形式主义与用于机器人动力学建模的最新库一样准确。

translated by 谷歌翻译

Iterative Depth-First Search for FOND Planning

Ramon Fraga Pereira , André G. Pereira , Frederico Messa , Giuseppe De Giacomo

分类：人工智能

2022-04-08

完全可观察到的非确定性（FONT）计划通过具有非确定性效果的行动模型不确定性。现有的FONS计划算法是有效的，并采用了广泛的技术。但是，大多数现有算法对于处理非确定性和任务规模并不强大。在本文中，我们开发了一种新颖的迭代深度优先搜索算法，该算法解决了精心的计划任务并产生了强大的循环策略。我们的算法是针对精心计划的明确设计的，更直接地解决了Fond Planning的非确定性方面，并且还利用了启发式功能的好处，以使算法在迭代搜索过程中更有效。我们将提出的算法与著名的Food Planners进行了比较，并表明它在考虑不同的指标的几种不同类型的FOND领域中具有良好的性能。

translated by 谷歌翻译

Discovering and forecasting extreme events via active learning in neural operators

Ethan Pickering , Stephen Guth , George Em Karniadakis , Themistoklis P. Sapsis

分类：机器学习 | (统计)机器学习

2022-04-05

社会和自然中的极端事件，例如大流行尖峰，流氓波浪或结构性失败，可能会带来灾难性的后果。极端的表征很困难，因为它们很少出现，这似乎是由良性的条件引起的，并且属于复杂且通常是未知的无限维系统。这种挑战使他们将其描述为“毫无意义”。我们通过将贝叶斯实验设计（BED）中的新型训练方案与深神经操作员（DNOS）合奏结合在一起来解决这些困难。这个模型不足的框架配对了一个床方案，该床方案积极选择数据以用近似于无限二二维非线性运算符的DNO集合来量化极端事件。我们发现，这个框架不仅清楚地击败了高斯流程（GPS），而且只有两个成员的浅色合奏表现最好； 2）无论初始数据的状态如何（即有或没有极端），都会发现极端； 3）我们的方法消除了“双研究”现象； 4）与逐步全球Optima相比，使用次优的采集点的使用不会阻碍床的性能； 5）蒙特卡洛的获取优于高量级的标准优化器。这些结论共同构成了AI辅助实验基础设施的基础，该基础设施可以有效地推断并查明从物理到社会系统的许多领域的关键情况。

translated by 谷歌翻译

BERT for Sentiment Analysis: Pre-trained and Fine-Tuned Alternatives

Frederico Souza , João Filho

分类：自然语言处理

2022-01-10

通过通过可以捕获复杂的文本模式的大型语言模型来转移学习，BERT通过能够捕获复杂的文本模式，达到最先进的NLP应用程序来彻底改变了NLP字段。对于文本分类任务，BERT已被广泛探索。然而，在文献中，如何更好地应对如何更好地应对伯特输出层提供的不同嵌入物以及特定于语言的使用，而不是在文献中进行了很好的研究，特别是对于巴西葡萄牙语。本文的目的是进行广泛的实验研究，有关聚集在伯特输出层中产生的特征的不同策略的实验研究，重点是情感分析任务。该实验包括培训的BERT模型，培训了巴西葡萄牙语集团和多语言版本，考虑了具有预定义的培训，验证和测试分区的多种聚合策略和开源数据集，以便于效果的再现性。与TF-IDF相比，BERT达到了大多数情况下的最高ROC-AUC值。尽管如此，TF-IDF代表了预测性能和计算成本之间的良好权衡。

translated by 谷歌翻译

Time Series Forecasting Using Fuzzy Cognitive Maps: A Survey

Omid Orang , Petrônio Cândido de Lima e Silva , Frederico Guimarães Gadelha

分类：人工智能 | 机器学习 | 神经与进化计算

2022-01-07

在时间序列预测的各种软计算方法中，模糊认知地图（FCM）已经显示出显着的结果作为模拟和分析复杂系统动态的工具。 FCM具有与经常性神经网络的相似之处，可以被分类为神经模糊方法。换句话说，FCMS是模糊逻辑，神经网络和专家系统方面的混合，它作为模拟和研究复杂系统的动态行为的强大工具。最有趣的特征是知识解释性，动态特征和学习能力。本调查纸的目标主要是在文献中提出的最相关和最近的基于FCCM的时间序列预测模型概述。此外，本文认为介绍FCM模型和学习方法的基础。此外，该调查提供了一些旨在提高FCM的能力的一些想法，以便在处理非稳定性数据和可扩展性问题等现实实验中涵盖一些挑战。此外，具有快速学习算法的FCMS是该领域的主要问题之一。

translated by 谷歌翻译

Introducing Randomized High Order Fuzzy Cognitive Maps as Reservoir Computing Models: A Case Study in Solar Energy and Load Forecasting

Omid Orang , Petrônio Cândido de Lima Silva , Frederico Gadelha Guimarães

分类：人工智能 | 机器学习 | 神经与进化计算

2022-01-06

模糊认知地图（FCMS）被出现为可解释的签名加权数字化方法，其由代表概念之间的依赖性的节点（概念）和权重。虽然FCMS在各种时间序列预测应用中取得了相当大的成果，但设计了具有较节约的训练方法的FCM模型仍然是一个开放的挑战。因此，本文介绍了一种新颖的单变量时间序列预测技术，该技术由标记为R-HFCM的一组随机高阶FCM模型组成。提出的R-HFCM模型的新颖性与将FCM和回声状态网络（ESN）的概念合并为高效且特定的储层计算（RC）模型系列，其中应用于训练模型的最小二乘算法。从另一个角度来看，R-HFCM的结构包括输入层，储存层和输出层，其中仅输出层是可训练的，同时在训练过程中随机选择每个子储存组件的重量并保持恒定。如案例研究，该模型考虑了与巴西太阳能站以及马来西亚数据集的公共数据的太阳能预测，包括马来西亚市柔佛市电源公司的每小时电负荷和温度数据。实验还包括地图尺寸，激活功能，偏置的存在和储存器的尺寸的效果，储存器的尺寸为R-HFCM方法的准确性。所获得的结果证实了所提出的R-HFCM模型与其他方法相比表现。本研究提供了证据表明，FCM可以是在时间序列建模中实施动态储存的新方法。

translated by 谷歌翻译

Sentiment Analysis on Brazilian Portuguese User Reviews

Frederico Souza , João Filho

分类：自然语言处理

2021-12-10

情感分析是最古典的，主要研究的自然语言处理任务之一。这个问题有一个值得注意的提前，主张更复杂和可扩展的机器学习模型。尽管存在这一进展，但巴西葡萄牙语仍然只处理了有限的语言资源，例如专用于情绪分类的数据集，特别是在考虑培训，测试和验证集中的预定义分区时，这将允许更公平地比较不同算法备择方案。这些问题的动机，这项工作分析了一系列文档嵌入策略的预测性能，假设极性作为系统结果。此分析包括在巴西葡萄牙语中的五种情感分析数据集，在单个数据集中统一，以及培训，测试和验证集中的引用分区，两者都通过数字存储库公开可用。进行不同上下文的数据集特定模型的交叉评估，以评估其泛化能力和采用唯一模型来解决所有方案的可行性。

translated by 谷歌翻译