智能论文笔记

Transfer Learning Approach to Bicycle-sharing Systems' Station Location Planning using OpenStreetMap Data

Kamil Raczycki , Piotr Szymański

分类：机器学习 | 人工智能

2021-11-01

自行车共享系统（BSS）已成为发达地区大众较大城市的许多公民的日常现实。然而，规划自行车共享站的布局通常需要昂贵的数据收集，测量旅行行为和跳闸建模，然后是站布局优化。许多小城镇，特别是在发展中地区，可能难以融资此类项目。规划BSS也需要相当多的时间。然而，随着大流行表明我们，市政当局将面临迅速适应流动性转变的必要性，包括留有自行车公共交通工具的公民。在解决自行车需求的增加方面，快速铺设自行车共享系统将变得至关重要。本文解决了BSS布局设计中的成本和时间问题，并提出了一种新的解决方案来简化和促进使用空间嵌入方法的这种规划的过程。仅基于来自OpenStreetMap的公开数据，以及来自欧洲34个城市的站布局，已经开发了一种使用优步H3离散全球电网系统将城市分成微区域的方法，并指示其值得放置站的区域在不同城市使用转移学习的现有系统。工作的结果是在规划驻地布局的决策中支持规划者的机制，以选择参考城市。

translated by 谷歌翻译

Predicting the Location of Bicycle-sharing Stations using OpenStreetMap Data

Kamil Raczycki

分类：机器学习 | 人工智能

2021-11-02

规划自行车共享站的布局是一个复杂的过程，特别是在刚刚实施自行车共享系统的城市。城市规划者通常必须根据公开可用的数据并私下提供来自管理的数据，然后使用现场流行的位置分配模型。较小城市的许多城市可能难以招聘专家进行此类规划。本文提出了一种新的解决方案来简化和促进通过使用空间嵌入方法来实现这种规划的过程。仅基于来自OpenStreetMap的公开数据，以及来自欧洲34个城市的站布局，已经开发了一种使用优步H3离散全球电网系统将城市分成微区域的方法，并指示其值得放置站的区域在不同城市使用转移学习的现有系统。工作的结果是在规划驻地布局的决策中支持规划者的机制，以选择参考城市。

translated by 谷歌翻译

Hex2vec -- Context-Aware Embedding H3 Hexagons with OpenStreetMap Tags

Szymon Woźniak , Piotr Szymański

分类：机器学习 | 人工智能

2021-11-01

空间和地理数据的表示学习是一种快速开发的领域，其允许使用深神经网络的区域和高质量推断之间的相似性检测。然而，过去的方法集中在嵌入光栅图像（地图，街道或卫星照片），移动数据或道路网络上。在本文中，我们提出了第一种关于在微区网格中的城市功能和土地利用的开放式车间地区的传染媒介表示的第一种方法。我们确定与土地使用，建筑和城市地区功能，水，绿色或其他自然区域的主要特征相关的OSM标签的子集。通过手动验证标记质量，我们选择了36个城市用于培训区域的陈述。优步的H3索引用于将城市划分为六边形，而OSM标签为每个六角形汇总。我们提出了基于负采样的跳过克模型的Hex2VEC方法。由此产生的矢量表示展示了地图特征的语义结构，类似于基于向量的语言模型中的存在。我们还在六个波兰城市中从区域相似性检测的见解，并提出了通过附聚类获得的区域类型。

translated by 谷歌翻译

Unsupervised embedding and similarity detection of microregions using public transport schedules

Piotr Gramacki

分类：机器学习

2021-11-03

空间数据在应对与城市相关的任务中的作用近年来一直在增长。要在机器学习模型中使用它们，通常需要将它们转换为向量表示，这导致了空间数据表示学习领域的开发。还有一种越来越多的各种空间数据类型，提出了一种表示学习方法。迄今为止，公共交通时间表迄今未被用于一个城市地区的学习陈述的任务。在这项工作中，开发了一种方法来将公共交通可用性信息嵌入到矢量空间中。要对其申请进行实验，从48个城市收集公共交通时间表。使用H3空间索引方法，它们被分成微区域。还提出了一种方法来识别具有类似公共交通报价特征的地区。在其基础上，定义了该地区的公共交通报价的多层次类型。本文表明，所提出的表示方法可以识别城市之间具有相似公共交通特性的微区域，并且可用于评估城市中可用的公共交通的质量。

translated by 谷歌翻译

gtfs2vec -- Learning GTFS Embeddings for comparing Public Transport Offer in Microregions

Piotr Gramacki , Szymon Woźniak , Piotr Szymański

分类：机器学习 | 人工智能

2021-11-01

我们选择了48个欧洲城市，并以GTFS格式聚集了公共交通时间表。我们利用优步的H3空间指数将每个城市划分为六角形微区域。基于时间表数据，我们创建了某些功能，描述了每个区域中的公共交通可用性的数量和各种功能。接下来，我们培训了一个自动关联的深神经网络来嵌入每个区域。具有这样的准备的表示，我们使用分层聚类方法来识别类似地区。为此，我们利用了一个附着的聚类算法，在地区和病房的方法之间具有欧几里德距离，以最小化簇内方差。最后，我们在不同级别分析了所获得的集群，以确定定性描述公共交通可用性的一些群集。我们认为，我们的类型与分析的城市的特征匹配，并允许成功寻找具有相似公共交通计划特征的地区。

translated by 谷歌翻译

Deep Learning based Urban Vehicle Trajectory Analytics

Seongjin Choi

分类：机器学习

2021-11-15

“轨迹”是指由地理空间中的移动物体产生的迹线，通常由一系列按时间顺序排列的点表示，其中每个点由地理空间坐标集和时间戳组成。位置感应和无线通信技术的快速进步使我们能够收集和存储大量的轨迹数据。因此，许多研究人员使用轨迹数据来分析各种移动物体的移动性。在本文中，我们专注于“城市车辆轨迹”，这是指城市交通网络中车辆的轨迹，我们专注于“城市车辆轨迹分析”。城市车辆轨迹分析提供了前所未有的机会，可以了解城市交通网络中的车辆运动模式，包括以用户为中心的旅行经验和系统范围的时空模式。城市车辆轨迹数据的时空特征在结构上相互关联，因此，许多先前的研究人员使用了各种方法来理解这种结构。特别是，由于其强大的函数近似和特征表示能力，深度学习模型是由于许多研究人员的注意。因此，本文的目的是开发基于深度学习的城市车辆轨迹分析模型，以更好地了解城市交通网络的移动模式。特别是，本文重点介绍了两项研究主题，具有很高的必要性，重要性和适用性：下一个位置预测，以及合成轨迹生成。在这项研究中，我们向城市车辆轨迹分析提供了各种新型模型，使用深度学习。

translated by 谷歌翻译

So2Sat POP -- A Curated Benchmark Data Set for Population Estimation from Space on a Continental Scale

Sugandha Doda , Yuanyuan Wang , Matthias Kahl , Eike Jens Hoffmann , Kim Ouan , Hannes Taubenböck , Xiao Xiang Zhu

分类：机器学习 | 人工智能 | (统计)机器学习

2022-04-07

Obtaining a dynamic population distribution is key to many decision-making processes such as urban planning, disaster management and most importantly helping the government to better allocate socio-technical supply. For the aspiration of these objectives, good population data is essential. The traditional method of collecting population data through the census is expensive and tedious. In recent years, statistical and machine learning methods have been developed to estimate population distribution. Most of the methods use data sets that are either developed on a small scale or not publicly available yet. Thus, the development and evaluation of new methods become challenging. We fill this gap by providing a comprehensive data set for population estimation in 98 European cities. The data set comprises a digital elevation model, local climate zone, land use proportions, nighttime lights in combination with multi-spectral Sentinel-2 imagery, and data from the Open Street Map initiative. We anticipate that it would be a valuable addition to the research community for the development of sophisticated approaches in the field of population estimation.

translated by 谷歌翻译

Understanding transit ridership in an equity context through a comparison of statistical and machine learning algorithms

Elnaz Yousefzadeh Barri , Steven Farber , Hadi Jahanshahi , Eda Beyazit

分类：机器学习

2022-11-30

Building an accurate model of travel behaviour based on individuals' characteristics and built environment attributes is of importance for policy-making and transportation planning. Recent experiments with big data and Machine Learning (ML) algorithms toward a better travel behaviour analysis have mainly overlooked socially disadvantaged groups. Accordingly, in this study, we explore the travel behaviour responses of low-income individuals to transit investments in the Greater Toronto and Hamilton Area, Canada, using statistical and ML models. We first investigate how the model choice affects the prediction of transit use by the low-income group. This step includes comparing the predictive performance of traditional and ML algorithms and then evaluating a transit investment policy by contrasting the predicted activities and the spatial distribution of transit trips generated by vulnerable households after improving accessibility. We also empirically investigate the proposed transit investment by each algorithm and compare it with the city of Brampton's future transportation plan. While, unsurprisingly, the ML algorithms outperform classical models, there are still doubts about using them due to interpretability concerns. Hence, we adopt recent local and global model-agnostic interpretation tools to interpret how the model arrives at its predictions. Our findings reveal the great potential of ML algorithms for enhanced travel behaviour predictions for low-income strata without considerably sacrificing interpretability.

translated by 谷歌翻译

Applications of deep learning in traffic congestion detection, prediction and alleviation: A survey

Nishant Kumar , Martin Raubal

分类：机器学习 | (统计)机器学习

2021-02-19

检测，预测和减轻交通拥堵是针对改善运输网络的服务水平的目标。随着对更高分辨率的更大数据集的访问，深度学习对这种任务的相关性正在增加。近年来几篇综合调查论文总结了运输领域的深度学习应用。然而，运输网络的系统动态在非拥挤状态和拥塞状态之间变化大大变化 - 从而需要清楚地了解对拥堵预测特异性特异性的挑战。在这项调查中，我们在与检测，预测和缓解拥堵相关的任务中，介绍了深度学习应用的当前状态。重复和非经常性充血是单独讨论的。我们的调查导致我们揭示了当前研究状态的固有挑战和差距。最后，我们向未来的研究方向提出了一些建议，因为所确定的挑战的答案。

translated by 谷歌翻译

Fine-grained Population Mapping from Coarse Census Counts and Open Geodata

Nando Metzger , John E. Vargas-Muñoz , Rodrigo C. Daudt , Benjamin Kellenberger , Thao Ton-That Whelan , Ferda Ofli , Muhammad Imran , Konrad Schindler , Devis Tuia

分类：机器学习 | 计算机视觉

2022-11-08

Fine-grained population maps are needed in several domains, like urban planning, environmental monitoring, public health, and humanitarian operations. Unfortunately, in many countries only aggregate census counts over large spatial units are collected, moreover, these are not always up-to-date. We present POMELO, a deep learning model that employs coarse census counts and open geodata to estimate fine-grained population maps with 100m ground sampling distance. Moreover, the model can also estimate population numbers when no census counts at all are available, by generalizing across countries. In a series of experiments for several countries in sub-Saharan Africa, the maps produced with POMELOare in good agreement with the most detailed available reference counts: disaggregation of coarse census counts reaches R2 values of 85-89%; unconstrained prediction in the absence of any counts reaches 48-69%.

translated by 谷歌翻译

Enabling Country-Scale Land Cover Mapping with Meter-Resolution Satellite Imagery

Xin-Yi Tong , Gui-Song Xia , Xiao Xiang Zhu

分类：计算机视觉

2022-09-01

高分辨率卫星图像可以为土地覆盖分类提供丰富的详细空间信息，这对于研究复杂的建筑环境尤为重要。但是，由于覆盖范围复杂的覆盖模式，昂贵的训练样品收集以及卫星图像的严重分布变化，很少有研究应用高分辨率图像来大规模详细类别的覆盖地图。为了填补这一空白，我们提出了一个大规模的土地盖数据集，即五亿像素。它包含超过50亿个标记的像素，这些像素由150个高分辨率Gaofen-2（4 M）卫星图像，在24类系统中注释，涵盖人工结构，农业和自然阶层。此外，我们提出了一种基于深度学习的无监督域适应方法，该方法可以转移在标记的数据集（称为源域）上训练的分类模型，以获取大型土地覆盖映射的无标记数据（称为目标域）。具体而言，我们采用动态伪标签分配和班级平衡策略来介绍一个端到端的暹罗网络，以执行自适应领域联合学习。为了验证我们的数据集的普遍性以及在不同的传感器和不同地理区域中提出的方法，我们对中国的五个大城市和其他五个亚洲国家的五个城市进行了土地覆盖地图，以下情况下使用：Planetscope（3 m），Gaofen-1，Gaofen-1 （8 m）和Sentinel-2（10 m）卫星图像。在总研究区域为60,000平方公里，即使输入图像完全未标记，实验也显示出令人鼓舞的结果。拟议的方法接受了5亿像素数据集的培训，可实现在整个中国和其他亚洲国家的高质量和详细的土地覆盖地图。

translated by 谷歌翻译

Towards an unsupervised large-scale 2D and 3D building mapping with airborne LiDAR data

Hunsoo Song , Jinha Jung

分类：计算机视觉

2022-05-29

2D和3D建筑图提供了宝贵的信息，以了解人类活动及其对地球及其环境的影响。尽管为提高建筑地图的质量而做出了巨大努力，但自动化方法产生的当前大规模建筑地图仍存在许多错误和不确定性，并且通常仅限于提供2D建筑信息。这项研究提出了一种开源无监督的2D和3D建筑物提取算法，并带有适用于大型建筑物映射的机载LIDAR数据。我们的算法以完全无监督的方式运行，不需要任何培训标签或培训程序。我们的算法由形态过滤和基于平面的过滤组成。因此，计算是有效的，结果易于预测，这可以大大减少所得建筑图中的不确定性。丹佛和纽约市的大规模数据集（> 550 $ km^2 $）的定量和定性评估表明，我们的算法比通过基于深度学习的方法生成的Microsoft Building Footprints可以产生更准确的建筑图。在不同条件下进行的广泛评估证实，我们的算法是可扩展的，可以通过适当的参数选择进一步改进。我们还详细介绍了参数和潜在错误来源的影响，以帮助我们算法的潜在用户。我们的基于激光雷达的算法具有优势，即生成2D和3D构建图在计算上有效，而它产生了准确且可解释的结果。我们提出的算法为带有机载激光雷达数据的全球尺度2D和3D建筑物映射提供了巨大的潜力。

translated by 谷歌翻译

Short term prediction of demand for ride hailing services: A deep learning approach

Long Chen , Piyushimita , Thakuriah , Konstantinos Ampountolas

分类：机器学习

2022-12-07

As ride-hailing services become increasingly popular, being able to accurately predict demand for such services can help operators efficiently allocate drivers to customers, and reduce idle time, improve congestion, and enhance the passenger experience. This paper proposes UberNet, a deep learning Convolutional Neural Network for short-term prediction of demand for ride-hailing services. UberNet empploys a multivariate framework that utilises a number of temporal and spatial features that have been found in the literature to explain demand for ride-hailing services. The proposed model includes two sub-networks that aim to encode the source series of various features and decode the predicting series, respectively. To assess the performance and effectiveness of UberNet, we use 9 months of Uber pickup data in 2014 and 28 spatial and temporal features from New York City. By comparing the performance of UberNet with several other approaches, we show that the prediction quality of the model is highly competitive. Further, Ubernet's prediction performance is better when using economic, social and built environment features. This suggests that Ubernet is more naturally suited to including complex motivators in making real-time passenger demand predictions for ride-hailing services.

translated by 谷歌翻译

From Twitter to Traffic Predictor: Next-Day Morning Traffic Prediction Using Social Media Data

Weiran Yao , Sean Qian

分类：机器学习 | (统计)机器学习

2020-09-29

在清晨预测交通动态时，传统交通预测方法的有效性通常非常有限。原因是在清晨通勤期间交通可能会彻底分解，这个分解的时间和持续时间大幅度从日常生活中变化。清晨的交通预测是通知午餐的交通管理至关重要，但他们通常会提前预测，特别是在午夜预测。在本文中，我们建议将Twitter消息作为探测方法，了解在前一天晚上/午夜的人们工作和休息模式的影响到下一天的早晨交通。该模型在匹兹堡的高速公路网络上进行了测试，作为实验。由此产生的关系令人惊讶地简单且强大。我们发现，一般来说，早些时候的人休息如推文所示，即第二天早上就越拥挤的道路就越多。之前的大事发生了大事，由更高或更低的Tweet情绪表示，比正常，通常意味着在第二天早上的旅行需求较低。此外，人们在前一天晚上和清晨的鸣叫活动与早晨高峰时段的拥堵有统计学相关。我们利用这种关系来构建一个预测框架，预测早晨的通勤充血使用5时或早晨午夜提取的人的推特型材。匹兹堡研究支持我们的框架可以精确预测早晨拥塞，特别是对于具有大型日常充血变异的道路瓶颈上游的一些道路段。我们的方法在没有Twitter消息功能的情况下大大差异，可以从提供管理洞察力的推文配置文件中学习有意义的需求表示。

translated by 谷歌翻译

The pascal visual object classes (voc) challenge

分类：

The PASCAL Visual Object Classes (VOC) challenge is a benchmark in visual object category recognition and detection, providing the vision and machine learning communities with a standard dataset of images and annotation, and standard evaluation procedures. Organised annually from 2005 to present, the challenge and its associated dataset has become accepted as the benchmark for object detection.This paper describes the dataset and evaluation procedure. We review the state-of-the-art in evaluated methods for both classification and detection, analyse whether the methods are statistically different, what they are learning from the images (e.g. the object or its context), and what the methods find easy or confuse. The paper concludes with lessons learnt in the three year history of the challenge, and proposes directions for future improvement and extension.

translated by 谷歌翻译

$k$-Anonymity in Practice: How Generalisation and Suppression Affect Machine Learning Classifiers

Djordje Slijepčević , Maximilian Henzl , Lukas Daniel Klausner , Tobias Dam , Peter Kieseberg , Matthias Zeppelzauer

分类：机器学习

2021-02-09

保护私人信息是数据驱动的研究和业务环境中的关键问题。通常，引入匿名或（选择性）删除之类的技术，以允许数据共享，e。 G。在协作研究的情况下。为了与匿名技术一起使用，$ k $ - 匿名标准是最受欢迎的标准之一，具有许多有关不同算法和指标的科学出版物。匿名技术通常需要更改数据，因此必然会影响在基础数据上训练的机器学习模型的结果。在这项工作中，我们对不同的$ k $ - 匿名算法对机器学习模型结果的影响进行了系统的比较和详细研究。我们研究了与不同分类器的一组流行的$ K $匿名算法，并在不同的现实数据集上对其进行评估。我们的系统评估表明，凭借越来越强的$ K $匿名性约束，分类性能通常会降低，但在不同程度上，并且强烈取决于数据集和匿名方法。此外，蒙德里安可以被视为具有最具吸引力的后续分类属性的方法。

translated by 谷歌翻译

A Review of Incident Prediction, Resource Allocation, and Dispatch Models for Emergency Management

Ayan Mukhopadhyay , Geoffrey Pettet , Sayyed Vazirizade , Di Lu , Said El Said , Alex Jaimes , Hiba Baroud , Yevgeniy Vorobeychik , Mykel Kochenderfer , Abhishek Dubey

分类：人工智能

2020-06-07

在过去的五十年中，研究人员已经开发了设计和改进了应急响应管理（ERM）系统的统计，数据驱动，分析和算法方法。该问题已被认为是本质上的困难，并且构成了不确定性下的时空决策，这在文献中已经解决了不同的假设和方法。该调查提供了对这些方法的详细审查，重点关注有关四个子流程的关键挑战和问题：（a）事件预测，（b）入射检测，（c）资源分配，和（c）计算机辅助调度紧急响应。我们突出了该领域前后工作的优势和缺点，并探讨了不同建模范式之间的相似之处和差异。我们通过说明这种复杂领域未来研究的开放挑战和机会的结论。

translated by 谷歌翻译

Tree-Based Dynamic Classifier Chains

Eneldo Loza Mencía , Moritz Kulessa , Simon Bohlender , Johannes Fürnkranz

分类：机器学习

2021-12-13

分类链是一种用于在多标签分类中建模标签依赖性的有效技术。但是，该方法需要标签的固定静态顺序。虽然理论上，任何顺序都足够了，实际上，该订单对最终预测的质量具有大量影响。动态分类链表示每个实例对分类的想法，可以动态选择预测标签的顺序。这种方法的天真实现的复杂性是禁止的，因为它需要训练一系列分类器，以满足标签的每种可能置换。为了有效地解决这个问题，我们提出了一种基于随机决策树的新方法，该方法可以动态地选择每个预测的标签排序。我们凭经验展示了下一个标签的动态选择，通过在否则不变的随机决策树模型下使用静态排序。％和实验环境。此外，我们还展示了基于极端梯度提升树的替代方法，其允许更具目标的动态分级链训练。我们的结果表明，该变体优于随机决策树和其他基于树的多标签分类方法。更重要的是，动态选择策略允许大大加速培训和预测。

translated by 谷歌翻译

Improving Operational Efficiency In EV Ridepooling Fleets By Predictive Exploitation of Idle Times

Jesper C. Provoost , Andreas Kamilaris , Gyözö Gidófalvi , Geert J. Heijenk , Luc J. J. Wismans

分类：机器学习 | 人工智能

2022-08-30

在带有电动车队的乘车系统中，充电是一个复杂的决策过程。大多数电动汽车（EV）出租车服务要求驾驶员做出利己主义决定，从而导致分散的临时充电策略。车辆之间通常缺乏或不共享移动性系统的当前状态，因此无法做出最佳的决定。大多数现有方法都不将时间，位置和持续时间结合到全面的控制算法中，也不适合实时操作。因此，我们提出了一种实时预测性充电方法，用于使用一个名为“闲置时间开发（ITX）”的单个操作员进行乘车服务，该方法预测了车辆闲置并利用这些时期来收获能量的时期。它依靠图形卷积网络和线性分配算法来设计最佳的车辆和充电站配对，以最大程度地提高利用的空闲时间。我们通过对纽约市现实世界数据集的广泛模拟研究评估了我们的方法。结果表明，就货币奖励功能而言，ITX的表现优于所有基线方法至少提高5％（相当于6,000个车辆操作的$ 70,000），该奖励奖励功能的建模旨在复制现实世界中乘车系统的盈利能力。此外，与基线方法相比，ITX可以将延迟至少减少4.68％，并且通常通过促进顾客在整个车队中更好地传播乘客的舒适度。我们的结果还表明，ITX使车辆能够在白天收获能量，稳定电池水平，并增加需求意外激增的弹性。最后，与表现最佳的基线策略相比，峰值负载减少了17.39％，这使网格操作员受益，并为更可持续的电网使用铺平了道路。

translated by 谷歌翻译

A Cluster-Based Trip Prediction Graph Neural Network Model for Bike Sharing Systems

Bárbara Tavares , Cláudia Soares , Manuel Marques

分类：机器学习

2022-01-03

自行车共享系统（BSSS）作为创新的运输服务。鉴于这些系统致力于通过促进环境和经济可持续性以及改善人口的生活质量，这些系统致力于消除当前全球担忧的许多担忧，确保BSS的正常运作至关重要。良好的用户过渡模式知识是对服务的质量和可操作性的决定性贡献。类似的和不平衡的用户的过渡模式导致这些系统遭受自行车不平衡，从长远来看，导致客户损失很大。自行车重新平衡的策略变得重要，以解决这个问题，为此，自行车交通预测至关重要，因为它允许更有效地运行并提前做出反应。在这项工作中，我们提出了一种基于图形神经网络嵌入的自行车TRIPS预测因子，考虑到站分组，气象条件，地理距离和旅行模式。我们在纽约市BSS（CITIBIKE）数据中评估了我们的方法，并将其与四个基线进行比较，包括非聚类方法。为了解决我们的问题的特殊性，我们开发了自适应转换约束聚类加（ADATC +）算法，消除了以前的工作的缺点。我们的实验证据证据细胞化（88％的准确性，而无需聚类83％），哪种聚类技术最适合这个问题。对于ADATC +，链路预测任务的准确性总是较高，而不是基于基准群集方法，而当网站相同，虽然在升级网络时不会降低性能，但在训练有素的模型中不匹配。

translated by 谷歌翻译