智能论文笔记

Theoretical bounds on data requirements for the ray-based classification

Brian J. Weber , Sandesh S. Kalantre , Thomas McJunkin , Jacob M. Taylor , Justyna P. Zwolak

分类：机器学习 | 计算机视觉 | (统计)机器学习

2021-03-17

随着空间的尺寸增加，在真实数据中分类高维形状的问题在复杂性中增长。对于识别不同几何形状的凸形形状的情况，最近提出了一种新的分类框架，其中使用一种称为射线的一组一维表示的交叉点，其中具有形状的边界来识别特定几何形状。基于射线的分类（RBC）已经使用两维和三维形状的合成数据集进行了经验验证的（Zwolak等人。在第三讲习班关于机器学习和物理科学（Neurips 2020），温哥华，加拿大的第三次研讨会的程序中[ arxiv：2010年12月11日，2010年12月11日，最近也已经通过实验验证（Zwolak等，Prx量子2：020335,2021）。在这里，我们建立了由关键角度度量定义的形状分类所需的光线数量的绑定，用于任意凸形形状。对于两个维度，我们在形状的长度，直径和外部角度方面导出了射线数量的下限。对于$ \ mathbb {r} ^ n $的凸多台，我们将此结果概括为与二向角度的函数和多边形面的几何参数给出的类似绑定。该结果使得能够使用比体积或基于表面的方法基本更少的数据元素估计高维形状的不同方法。

translated by 谷歌翻译

Nearest Neighbor Sampling of Point Sets using Random Rays

Liangchen Liu , Louis Ly , Colin Macdonald , Yen-Hsi Richard Tsai

分类：计算机视觉 | 机器学习

2019-11-25

We propose a new framework for the sampling, compression, and analysis of distributions of point sets and other geometric objects embedded in Euclidean spaces. Nearest neighbors of points on a set of randomly selected rays are recorded into a tensor, called the RaySense signature. From the signature, statistical information about the data set, as well as certain geometrical information, can be extracted, independent of the ray set. We present a few examples illustrating applications of the proposed sampling strategy.

translated by 谷歌翻译

Colloquium: Advances in automation of quantum dot devices control

Justyna P. Zwolak , Jacob M. Taylor

分类：计算机视觉 | 机器学习

2021-12-17

量子点（QDS）阵列是一个有前途的候选系统，实现可扩展的耦合码头系统，并用作量子计算机的基本构建块。在这种半导体量子系统中，设备现在具有数十个，必须仔细地将系统仔细设置为单电子制度并实现良好的Qubit操作性能。必要点位置的映射和栅极电压的电荷提出了一个具有挑战性的经典控制问题。随着QD Qubits越来越多的QD Qubits，相关参数空间的增加充分以使启发式控制不可行。近年来，有一个相当大的努力自动化与机器学习（ML）技术相结合的基于脚本的算法。在这一讨论中，我们概述了QD器件控制自动化进展的全面概述，特别强调了在二维电子气体中形成的基于硅和GaAs的QD。将基于物理的型号与现代数值优化和ML相结合，证明在屈服高效，可扩展的控制方面已经证明非常有效。通过计算机科学和ML的理论，计算和实验努力的进一步整合，在推进半导体和量子计算平台方面具有巨大的潜力。

translated by 谷歌翻译

Learning Coulomb Diamonds in Large Quantum Dot Arrays

Oswin Krause , Anasua Chatterjee , Ferdinand Kuemmeth , Evert van Nieuwenburg

分类：机器学习

2022-05-03

我们介绍了一种能够在量子点阵列中找到库仑钻石的方面的算法。我们使用恒定相互作用模型模拟这些阵列，并仅依靠一维栅格扫描（射线）使用正则化最大似然估计来学习设备的模型。这使我们能够确定设备的给定电荷状态，过渡的存在以及它们的补偿门电压是什么。对于较小的设备，模拟器还可以用于计算库仑钻石的确切边界，我们用来评估我们的算法正确地找到了具有高精度的绝大多数过渡。

translated by 谷歌翻译

Lunaport: Math, Mechanics & Transport

Paul C. Kainen

分类：机器人

2021-07-30

讨论了与科学，工程，建筑和人为因素相关的月球表面上的运输设施问题。未来十年制造的后勤决策可能对财务成功至关重要。除了概述一些问题及其与数学和计算的关系外，本文还为决策者，科学家和工程师提供了有用的资源。

translated by 谷歌翻译

On the Whitney extension problem for near isometries and beyond

Steven B. Damelin

分类：计算机视觉 | 机器学习

2021-03-17

在此备忘录中，我们开发了一般框架，它允许同时研究$ \ MathBB R ^ D $和惠特尼在$ \ Mathbb r的离散和非离散子集附近的insoctry扩展问题附近的标签和未标记的近对准数据问题。^ d $与某些几何形状。此外，我们调查了与集群，维度减少，流形学习，视觉以及最小的能量分区，差异和最小最大优化的相关工作。给出了谐波分析，计算机视觉，歧管学习和与我们工作的信号处理中的众多开放问题。本发明内容中的一部分工作基于纸张中查尔斯Fefferman的联合研究[48]，[49]，[50]，[51]。

translated by 谷歌翻译

Pictorial and apictorial polygonal jigsaw puzzles: The lazy caterer model, properties, and solvers

Peleg Harel , Ohad Ben-Shahar

分类：计算机视觉 | 人工智能

2020-08-17

拼图解决问题，从一组非重叠的无序视觉碎片构建一个连贯的整体，是许多应用的基础，然而，过去二十年的大部分文献都集中在较不太现实的谜题上正方形。在这里，我们正规化一种新型的拼图拼图，其中碎片是通过用任意数量的直切割的全局多边形/图像切割而产生的一般凸多边形，这是由庆祝的懒人辅助er序列的产生模型。我们分析了这种难题的理论特性，包括在碎片被几何噪声被污染时解决它们的固有挑战。为了应对此类困难并获得易行的解决方案，我们摘要作为一种具有分层循环约束和分层重建过程的多体弹簧质量动态系统的问题。我们定义了评估指标，并在普通植物和图案谜题上呈现实验结果，以表明它们是完全自动溶解的。

translated by 谷歌翻译

3D Labeling Tool

John Rachwan , Charbel Zalaket

分类：计算机视觉 | 人工智能

2022-07-23

培训和测试监督对象检测模型需要大量带有地面真相标签的图像。标签定义图像中的对象类及其位置，形状以及可能的其他信息，例如姿势。即使存在人力，标签过程也非常耗时。我们引入了一个新的标签工具，用于2D图像以及3D三角网格：3D标记工具（3DLT）。这是一个独立的，功能丰富和跨平台软件，不需要安装，并且可以在Windows，MacOS和基于Linux的发行版上运行。我们不再像当前工具那样在每个图像上分别标记相同的对象，而是使用深度信息从上述图像重建三角形网格，并仅在上述网格上标记一次对象。我们使用注册来简化3D标记，离群值检测来改进2D边界框的计算和表面重建，以将标记可能性扩展到大点云。我们的工具经过最先进的方法测试，并且在保持准确性和易用性的同时，它极大地超过了它们。

translated by 谷歌翻译

On the effectiveness of persistent homology

Renata Turkeš , Guido Montúfar , Nina Otter

分类：机器学习

2022-06-21

持续的同源性（PH）是拓扑数据分析中最流行的方法之一。尽管PH已用于许多不同类型的应用程序中，但其成功背后的原因仍然难以捉摸。特别是，尚不知道哪种类别的问题最有效，或者在多大程度上可以检测几何或拓扑特征。这项工作的目的是确定pH在数据分析中比其他方法更好甚至更好的问题。我们考虑三个基本形状分析任务：从形状采样的2D和3D点云中检测孔数，曲率和凸度。实验表明，pH在这些任务中取得了成功，超过了几个基线，包括PointNet，这是一个精确地受到点云的属性启发的体系结构。此外，我们观察到，pH对于有限的计算资源和有限的培训数据以及分布外测试数据，包括各种数据转换和噪声，仍然有效。

translated by 谷歌翻译

Reliability analysis of discrete-state performance functions via adaptive sequential sampling with detection of failure surfaces

Miroslav Vořechovský

分类：机器学习

2022-08-04

本文为工程产品的计算模型或仅返回分类信息的过程提供了一种新的高效和健壮方法，用于罕见事件概率估计，例如成功或失败。对于此类模型，大多数用于估计故障概率的方法，这些方法使用结果的数值来计算梯度或估计与故障表面的接近度。即使性能函数不仅提供了二进制输出，系统的状态也可能是连续输入变量域中定义的不平滑函数，甚至是不连续的函数。在这些情况下，基于经典的梯度方法通常会失败。我们提出了一种简单而有效的算法，该算法可以从随机变量的输入域进行顺序自适应选择点，以扩展和完善简单的基于距离的替代模型。可以在连续采样的任何阶段完成两个不同的任务：（i）估计失败概率，以及（ii）如果需要进一步改进，则选择最佳的候选者进行后续模型评估。选择用于模型评估的下一个点的建议标准最大化了使用候选者分类的预期概率。因此，全球探索与本地剥削之间的完美平衡是自动维持的。该方法可以估计多种故障类型的概率。此外，当可以使用模型评估的数值来构建平滑的替代物时，该算法可以容纳此信息以提高估计概率的准确性。最后，我们定义了一种新的简单但一般的几何测量，这些测量是对稀有事实概率对单个变量的全局敏感性的定义，该度量是作为所提出算法的副产品获得的。

translated by 谷歌翻译

Exponential advantage on noisy quantum computers

Ismail Yunus Akhalwaya , Shashanka Ubaru , Kenneth L. Clarkson , Mark S. Squillante , Vishnu Jejjala , Yang-Hui He , Kugendran Naidoo , Vasileios Kalantzis , Lior Horesh

分类：机器学习

2022-09-19

量子计算为某些问题提供了指数加速的潜力。但是，许多具有可证明加速的现有算法都需要当前不可用的耐故障量子计算机。我们提出了NISQ-TDA，这是第一个完全实现的量子机学习算法，其在任意经典（非手动）数据上具有可证明的指数加速，并且仅需要线性电路深度。我们报告了我们的NISQ-TDA算法的成功执行，该算法应用于在量子计算设备以及嘈杂的量子模拟器上运行的小数据集。我们从经验上证实，该算法对噪声是可靠的，并提供了目标深度和噪声水平，以实现现实世界中问题的近期，无耐受耐受性的量子优势。我们独特的数据加载投影方法是噪声鲁棒性的主要来源，引入了一种新的自我校正数据加载方法。

translated by 谷歌翻译

IAN: Iterated Adaptive Neighborhoods for manifold learning and dimensionality estimation

Luciano Dyballa , Steven W. Zucker

分类：机器学习 | 人工智能

2022-08-19

在机器学习中调用多种假设需要了解歧管的几何形状和维度，理论决定了需要多少样本。但是，在应用程序数据中，采样可能不均匀，歧管属性是未知的，并且（可能）非纯化；这意味着社区必须适应本地结构。我们介绍了一种用于推断相似性内核提供数据的自适应邻域的算法。从本地保守的邻域（Gabriel）图开始，我们根据加权对应物进行迭代率稀疏。在每个步骤中，线性程序在全球范围内产生最小的社区，并且体积统计数据揭示了邻居离群值可能违反了歧管几何形状。我们将自适应邻域应用于非线性维度降低，地球计算和维度估计。与标准算法的比较，例如使用K-Nearest邻居，证明了它们的实用性。

translated by 谷歌翻译

Localization with Few Distance Measurements

Dan Halperin , Steven M. LaValle , Barak Ugav

分类：机器人

2022-09-11

给定一个Polygon $ W $，将深度传感器放置在$ w $内部$ p =（x，y）$的深度传感器，并向方向定向$ \ theta $测量距离$ d = h（x，x，y，\ theta）$ $ p $和$ w $边界上的最接近点之间的射线散发出$ p $ in Doriess $ \ theta $。我们研究以下问题：给出一个多边形$ w $，可能带有漏洞，带有$ n $顶点，使其进行预处理，以便给定查询实际值$ d \ geq 0 $，一个人可以有效地计算preimage $ h^{ - 1}（d）$，即确定放置在$ w $中的深度传感器的所有可能的姿势（位置和方向），这些传感器将产生读取$ d $。我们采用$ w \ times s^1 $的分解，这是著名的梯形分解的延伸，我们称之为旋转梯形分解并呈现有效的数据结构，并以相对于输出敏感的方式计算出预先映射的数据结构这种分解：如果分解的$ k $单元有助于最终结果，我们将以$ O（k+1）$ time报告它们，之后$ O（n^2 \ log n）$ preadocessing时间并使用$ o （n^2）$存储空间。我们还分析了预映射到多边形$ w $的形状；该投影描述了传感器可以放置的$ W $的部分。此外，我们获得了更有用的情况（缩小可能的姿势集）的类似结果，其中传感器从同一点$ p $，一个方向$ \ theta $进行两个深度测量，另一个朝向方向$ \ \ \ \ \ \ theta+\ pi $。虽然机器人技术中的本地化问题通常是通过探索放置在环境固定点的传感器的完整可见性多边形来实现的，但我们在这里提出的方法仅需少量的深度测量，这是有利的，因为它允许，这是有利的用于使用廉价的传感器，也可能导致存储和通信成本节省。

translated by 谷歌翻译

Shining light on data: Geometric data analysis through quantum dynamics

Akshat Kumar , Mohan Sarovar

分类：机器学习 | (统计)机器学习

2022-12-01

Experimental sciences have come to depend heavily on our ability to organize, interpret and analyze high-dimensional datasets produced from observations of a large number of variables governed by natural processes. Natural laws, conservation principles, and dynamical structure introduce intricate inter-dependencies among these observed variables, which in turn yield geometric structure, with fewer degrees of freedom, on the dataset. We show how fine-scale features of this structure in data can be extracted from \emph{discrete} approximations to quantum mechanical processes given by data-driven graph Laplacians and localized wavepackets. This data-driven quantization procedure leads to a novel, yet natural uncertainty principle for data analysis induced by limited data. We illustrate the new approach with algorithms and several applications to real-world data, including the learning of patterns and anomalies in social distancing and mobility behavior during the COVID-19 pandemic.

translated by 谷歌翻译

Boundary Estimation from Point Clouds: Algorithms, Guarantees and Applications

Jeff Calder , Sangmin Park , Dejan Slepčev

分类： (统计)机器学习

2021-11-05

我们调查识别来自域中的采样点的域的边界。我们向边界引入正常矢量的新估计，指向边界的距离，以及对边界条内的点位于边界的测试。可以有效地计算估算器，并且比文献中存在的估计更准确。我们为估算者提供严格的错误估计。此外，我们使用检测到的边界点来解决Point云上PDE的边值问题。我们在点云上证明了LAPLACH和EIKONG方程的错误估计。最后，我们提供了一系列数值实验，说明了我们的边界估计器，在点云上的PDE应用程序的性能，以及在图像数据集上测试。

translated by 谷歌翻译

Intriguing Properties of Input-dependent Randomized Smoothing

Peter Súkeník , Aleksei Kuvshinov , Stephan Günnemann

分类：机器学习 | 人工智能 | (统计)机器学习

2021-10-11

当前，随机平滑被认为是获得确切可靠分类器的最新方法。尽管其表现出色，但该方法仍与各种严重问题有关，例如``认证准确性瀑布''，认证与准确性权衡甚至公平性问题。已经提出了依赖输入的平滑方法，目的是克服这些缺陷。但是，我们证明了这些方法缺乏正式的保证，因此所产生的证书是没有道理的。我们表明，一般而言，输入依赖性平滑度遭受了维数的诅咒，迫使方差函数具有低半弹性。另一方面，我们提供了一个理论和实用的框架，即使在严格的限制下，即使在有维度的诅咒的情况下，即使在存在维度的诅咒的情况下，也可以使用依赖输入的平滑。我们提供平滑方差功能的一种混凝土设计，并在CIFAR10和MNIST上进行测试。我们的设计减轻了经典平滑的一些问题，并正式下划线，但仍需要进一步改进设计。

translated by 谷歌翻译

Clustering -- Basic concepts and methods

Jan-Oliver Felix Kapp-Joswig , Bettina G. Keller

分类：机器学习

2022-12-01

We review clustering as an analysis tool and the underlying concepts from an introductory perspective. What is clustering and how can clusterings be realised programmatically? How can data be represented and prepared for a clustering task? And how can clustering results be validated? Connectivity-based versus prototype-based approaches are reflected in the context of several popular methods: single-linkage, spectral embedding, k-means, and Gaussian mixtures are discussed as well as the density-based protocols (H)DBSCAN, Jarvis-Patrick, CommonNN, and density-peaks.

translated by 谷歌翻译

Generalization in quantum machine learning from few training data

Matthias C. Caro , Hsin-Yuan Huang , M. Cerezo , Kunal Sharma , Andrew Sornborger , Lukasz Cincio , Patrick J. Coles

分类：机器学习 | (统计)机器学习

2021-11-09

现代量子机学习（QML）方法涉及在训练数据集上进行各种优化参数化量子电路，并随后对测试数据集（即，泛化）进行预测。在这项工作中，我们在培训数量为N $培训数据点后，我们在QML中对QML的普遍表现进行了全面的研究。我们表明，Quantum机器学习模型的泛化误差与$ T $培训门的尺寸在$ \ sqrt {t / n} $上缩放。当只有$ k \ ll t $ gates在优化过程中经历了大量变化时，我们证明了泛化误差改善了$ \ sqrt {k / n} $。我们的结果意味着将Unitaries编制到通常使用指数训练数据的量子计算行业的多项式栅极数量，这是一项通常使用指数尺寸训练数据的大量应用程序。我们还表明，使用量子卷积神经网络的相位过渡的量子状态的分类只需要一个非常小的训练数据集。其他潜在应用包括学习量子误差校正代码或量子动态模拟。我们的工作将新的希望注入QML领域，因为较少的培训数据保证了良好的概括。

translated by 谷歌翻译

Effects of Data Geometry in Early Deep Learning

Saket Tiwari , George Konidaris

分类：机器学习 | 人工智能

2022-12-29

Deep neural networks can approximate functions on different types of data, from images to graphs, with varied underlying structure. This underlying structure can be viewed as the geometry of the data manifold. By extending recent advances in the theoretical understanding of neural networks, we study how a randomly initialized neural network with piece-wise linear activation splits the data manifold into regions where the neural network behaves as a linear function. We derive bounds on the density of boundary of linear regions and the distance to these boundaries on the data manifold. This leads to insights into the expressivity of randomly initialized deep neural networks on non-Euclidean data sets. We empirically corroborate our theoretical results using a toy supervised learning problem. Our experiments demonstrate that number of linear regions varies across manifolds and the results hold with changing neural network architectures. We further demonstrate how the complexity of linear regions is different on the low dimensional manifold of images as compared to the Euclidean space, using the MetFaces dataset.

translated by 谷歌翻译

Fitting and recognition of geometric primitives in segmented 3D point clouds using a localized voting procedure

Andrea Raffo , Chiara Romanengo , Bianca Falcidieno , Silvia Biasotti

分类：计算机视觉

2022-05-30

从点云中自动创建几何模型在CAD（例如，逆向工程，制造，组装）中具有许多应用，并且通常在形状建模和处理中。给定一个代表人造对象的分段点云，我们提出了一种识别简单几何原语及其相互关系的方法。我们的方法基于Hough Transform（HT），以应对噪音，缺失零件和离群值的能力。在我们的方法中，我们介绍了一种用于处理分段点云的新技术，该技术通过投票程序能够提供表征每种原始类型的几何参数的初始估计。通过使用这些估计值，我们将对最佳解决方案的搜索定位在尺寸还原的参数空间中，从而使将HT扩展到比文献（即平面和球体中通常发现的）更有效。然后，我们提取了许多以唯一特征段的几何描述符，并且根据这些描述符，我们展示了如何汇总原语（段）（段）。对合成和工业扫描的实验揭示了原始拟合方法的鲁棒性及其在推断细分之间关系的有效性。

translated by 谷歌翻译