首页 > 其他分享 >PEMs数据集

PEMs数据集

时间:2023-12-23 22:48:29浏览次数:9  
标签:PEMs 探测器 采集 数据 节点 占有率

交通流量数据PEMs数据集说明

 

 distance_df_filename (str): path of the csv file contains edges information

        tuple: two adjacency matrix.
         adj_PEMS07.pkl     np.array: connectivity-based adjacency matrix A (A[i, j]=0 or A[i, j]=1)
           adj_PEMS07_distance.pkl    np.array: distance-based adjacency matrix A

 

 

 



最近刚开始学习有关交通流量数据分析处理方面的内容,将学习过程中对pems数据集的理解记录如下。


PEMs数据集的数据采集方式:

由分布在不同地点的xxx个探测器每隔5分钟采集一次,连续采集xxx天。

例如PEMS04是由307个探测器每隔5分钟采集一次数据,共采集59天产生的交通流量数据;

PEMS08是由170个探测器每隔5分钟采集一次,共采集62天产生的数据。
并且,每个探测器每次采集的数据包含三个维度的特征,分别为:流量、平均速度和平均占有率

这里对平均占有率进行说明:占有率分为时间占有率和空间占有率,是衡量道路被利用程度的重要指标(我认为它也衡量了拥挤程度)。其中,空间占有率是指在观测时间内,观测路段中各车辆所占道路面积总量与区域道路面积总量的比值;时间占有率是指在观测时间内通过道路某断面的累计时间与该段时间的比值。平均占有率的话取个平均就是了。

基于以上说明,理论上PEMs数据集中的数据维度应该为:

PEMS04:(16992,307,3)
307是指307个探测器,3是指每个探测器每次采集的数据有3个维度特征,16992=59×24×12 (每隔5分钟采集一次数据,因此一小时内可以采集12次,而一天有24小时,又采集了59天,因此就是59×24×12=16992了)

PEMS08:(62×24×12=17856, 170, 3)
csdn上已有大佬将数据可视化如下:(附博客链接GNN交通流量预测_pems04数据集介绍-CSDN博客)

 
这张图是PEMS数据中一个节点(也就是一个探测器)一天的观测数据,横坐标就是时间度量,上面我们说了探测器每隔五分钟采一次数据,因此一天中采集了288次数据,可以看到上面的图在横坐标也就是时间上展开大致就是0-288,与之前所述符合。三条不同颜色的线对应的就是包含3个维度特征的数据。

然后说一下数据集实际下载下来是什么样子的。(可能有些许偏差,因为我还没自己下载,不过在网上看到的视频里面好像大差不差)

PEMs数据集总的来说包含两部分:

一是csv文件,存储节点之间的边信息
二是npz压缩文件,存储的就是上面说的PEMs数据

上面说过了npz文件里存储的PEMs数据是啥玩意,在此再对csv文件进行说明。csv文件里保存着格式为(from,to,cost)的节点边信息,from是指源节点,to是指目标节点,cost是代价、成本。举个例子,(9, 153, 310.6)的意思是编号为9的节点(探测器)到编号为153的节点(探测器)的成本(其实就是距离)是310.6。
————————————————
链接:https://blog.csdn.net/weixin_51399904/article/details/134351695

 

标签:PEMs,探测器,采集,数据,节点,占有率
From: https://www.cnblogs.com/emanlee/p/17923764.html

相关文章

  • C++简单实现list链表数据结构(一)
    链表(list)是一种物理存储单元上非连续的存储结构,数据元素的逻辑顺序是通过链表中的指针链接实现的。链表的组成:链表由一系列结点组成结点的组成:一个是存储数据元素的数据域,另一个是存储下一个结点地址的指针域C++STL中的链表是一个双向循环链表由于链表的存储方式并不是连续的内存空......
  • java接口自动化系列(05):测试数据注入到测试方法
     注入测试数据这里我们是数据驱动方式,把数据注入到测试方法上一篇我们已经把用例数据封装到对象并放到list中,这里我们把用例对象list中的对象分别放到Object类型的一维数组中,再把一维数组添加到新对象类型一维数组的list中然后我们在测方法中打印获取到的用例数据,看获取到的......
  • 性能测试之Mysql数据库调优
    一、前言性能调优前提:无监控不调优,对于mysql性能的监控前几天有文章提到过,有兴趣的朋友可以去看一下二、Mysql性能指标及问题分析和定位1、我们在监控图表中关注的性能指标大概有这么几个:CPU、内存、连接数、io读写时间、io操作时间、慢查询、系统平均负载以及memoryOver2、介......
  • Redis7 数据双写一致性
    1、缓存双写一致性如果redis中有数据,需要和数据库中的值相同如果redis中无数据,数据库中的值要是最新值,且准备回写redis缓存细分1、只读缓存2、读写缓存2.1、同步直写策略写数据库后也同步写redis缓存,缓存和数据库中的数据一致对于读写缓存来说,要想保证缓存和数据库中的数据......
  • 网络与数据安全领域的框架模型
    1.PDR模型PDR模型是由美国国际互联网安全系统公司(ISS)提出,它是最早体现主动防御思想的一种网络安全模型。保护(Protection)就是采用一切可能的措施来保护网络、系统以及信息的安全。保护通常采用的技术及方法主要包括加密、认证、访问控制、防火墙以及防病毒等。检测(Detection)可以......
  • openGauss学习笔记-170 openGauss 数据库运维-备份与恢复-导入数据-更新表中数据-使用
    openGauss学习笔记-170openGauss数据库运维-备份与恢复-导入数据-更新表中数据-使用合并方式更新和插入数据在用户需要将一个表中所有的数据或大量的数据添加至现有表的场景下,openGauss提供了MERGEINTO语句通过两个表合并的方式高效地将新数据添加到现有表。MERGEINTO语句将......
  • openGauss学习笔记-171 openGauss 数据库运维-备份与恢复-导入数据-深层复制
    openGauss学习笔记-171openGauss数据库运维-备份与恢复-导入数据-深层复制171.1使用CREATETABLE执行深层复制该方法使用CREATETABLE语句创建原始表的副本,将原始表的数据填充至副本并重命名副本,完成原始表的复制。在创建新表时,可以指定表以及列属性,比如主键。171.1.1操作......
  • 6.PG数据库管理
    1.PG数据库库属主PG中的数据库属主属于创建者,只要有cretedb权限就可以创建数据库,数据库属主不一定拥有存放在该数据库中其它用户创建的对象的访问权限。数据库在创建后,允许public角色连接,即允许任何人连接数据库在创建后,不允许除了超级用户和owner之外的任何人在数据库中创建s......
  • Python数据科学手册笔记:IPython
    目录Ipython帮助文档用符号?来查来文档用??来获取源代码补全方法利用tab利用*加?来补全Ipython快捷键Ipython魔法命令粘贴代码块执行外部代码计算代码运行时间内存分析魔法函数帮助错误和调试控制异常:%xmode调试模型:%debug输入输出历史禁止输出历史输入Ipython和shell命令Ipyth......
  • 什么是数据埋点
    今天学习了一个新的内容--数据埋点,虽然我也是10多年的数据分析师了,但坦白讲,最近才听过这个名词,大家一起了解一下吧。一、定义埋点分析,是网站分析的一种常用的数据采集方法,指在需要采集数据的“操作节点”将数据采集的程序代码附加在功能程序代码中,对操作节点上用户行为或事件进行捕......