2023年11月1日,还有两个月,2023年就要结束了,希望在结束之前我能有所收获和进步,冲呀,老咸鱼。
摘要
解决了访问和利用不同来源、不同格式存储的不同城市时空数据集,以及确定有效的模型结构和组件。
1.为城市时空大数据设计的统一存储格式“原子文件”,并在40个不同的数据集上验证了其有效性,简化了数据管理。
2.概述了城市时空预测模型的技术进步,指导稳健模型的发展
3.用不同的模型和数据集进行了广泛的实验,建立了绩效排行版,并确定了有前景的研究方向。
1 引言
城市时空预测在城市计算中发挥着至关重要的作用,可帮助智慧城市实现高效管理和决策。各种应用都受益于城市时空预测,包括拥堵控制 [15]、路线规划 [30]、车辆调度 [77] 和 POI 推荐 [69]。
城市时空数据与传统时间序列数据的根本区别在于,时空数据由多个空间实体的历史状态时间序列组成,这些实体之间存在相互影响。因此,时空预测问题可以表述为多变量时间序列预测问题 [6, 54],而不是单变量时间序列预测问题 [24]。有效模拟不同实体时间序列之间的空间关系是解决时空预测问题的关键。
图卷积网络(GCN)是捕捉城市时空数据中空间依赖性的热门选择。学习图结构已成为时空预测的主流方法,人们还探索了空间注意力机制,以捕捉变量之间的动态图结构。
在深度学习技术发展和大规模数据集可用性的推动下,城市时空预测领域正在经历快速发展。然而,仍有几个挑战需要解决: 首先,由于现有城市时空数据集的来源和格式各不相同,访问和利用这些数据集具有挑战性。这些数据集通常以不同的格式存储,如 NPZ、PKL、H5、CSV 等。这种异质性给用户有效利用和探索数据集造成了障碍,尤其是对该领域的新手而言。这阻碍了该领域的发展和标准化,也为有效的数据管理和利用带来了障碍。
其次,随着该领域深度学习模型的激增,确定有效的模型结构和设计变得越来越困难。深度学习模型在时空预测方面表现出了最先进的性能,导致该领域的研究论文激增。然而,随着模型变得越来越复杂和多样化,确定哪些技术是真正有效的,哪些方向具有未来研究的潜力,就变得非常具有挑战性。深度学习模型对实验参数和配置的敏感性进一步强调了探索有价值的研究方向和确定最有前途的方法的必要性。为了应对上述挑战,我们在本文中做出了以下贡献:
(1) 统一存储格式: 我们介绍了一种专为城市时空大数据设计的统一存储格式--"原子文件"。通过对 40 个不同数据集的验证,我们证明了这种格式在简化城市时空数据管理方面的有效性。这一贡献解决了以不同格式存储的各种数据集的访问和利用难题,实现了准确高效的城市预测,并增强了相关应用。
(2) 技术发展路线图: 我们全面概述了城市时空预测模型的技术进步。该路线图概述了利用深度学习对空间依赖性、时间依赖性和时空融合进行有效建模的技术。通过提供这一路线图,我们促进了先进、稳健的城市时空预测模型的开发,使研究人员能够充分利用深度学习在这一领域的潜力。
(3) 广泛的实验和性能评估:我们使用 18 个模型和 20 个数据集进行了广泛的实验,建立了性能排行榜,并对空间-时间预测领域的前人工作进行了比较。通过这些实验,我们获得了对模型性能的宝贵见解,并确定了未来有希望的研究方向。这项评估可以帮助研究人员和从业人员做出明智的决策,推动城市时空预测的进步。
通过介绍原子文件存储格式、提供技术路线图和进行综合实验,我们为有效管理城市时空数据、指导未来研究工作和促进准确高效的城市时空预测模型的开发做出了贡献。这些贡献旨在应对该领域面临的挑战,加快城市时空预测的进展,最终提高城市生活质量。
2 统一的时空数据管理
2.1时空数据单元
本节将分析城市时空数据的基本单位。
2.1.1 基本单元。时空数据的最基本单位是地理单元。根据空间分布的差异,基本地理单元数据分为三种类型:
(1) 基于点的数据: 这类数据主要包括城市兴趣点(POI)数据、GPS 采样点、城市交通传感器、交通摄像头和其他设备数据。我们可以用(
标签:城市,Management,预测,Temporal,Spatial,空间,时空,数据,模型 From: https://www.cnblogs.com/ZERO-/p/17803346.html