首页 > 其他分享 >轨迹数据 (三)

轨迹数据 (三)

时间:2024-11-03 11:58:01浏览次数:1  
标签:轨迹 cdot text 模型 道路 数据 GPS

Here's the organized markdown text for LightTR: A Lightweight Framework for Federated Trajectory Recovery.


LightTR: A Lightweight Framework for Federated Trajectory Recovery

数据形式

根据提供的图片,这项研究的主题是关于联邦轨迹恢复问题,主要涉及GPS轨迹数据。以下是数据和任务的总结:

使用的数据

  1. 道路网络:表示为一个有向图 $ G = (V, E) $,其中 $ V $ 表示道路的交叉口或终点,$ E $ 表示有向道路段。
  2. GPS点:包含纬度、经度和附加属性(如时间戳)的点,表示为 $ \langle lat, lng, \gamma \rangle $。
  3. 不完整轨迹:由一些GPS点组成的序列,其中部分数据缺失,表示为原始或不完整轨迹 $ \tau = \langle (p_1, t_1), (p_2, t_2), \dots, (p_n, t_n) \rangle $。
  4. 地图匹配轨迹:将GPS轨迹投影到道路网络上的过程,通过已知的道路路径来校准GPS点,从而减少原始GPS数据中的噪声或误差。
  5. 不完整地图匹配轨迹:类似于地图匹配轨迹,但其中包含一些缺失点,需要进行补全。

任务

联邦轨迹恢复问题的目标是恢复缺失的GPS轨迹数据。在这个框架中:

  • 多个客户端(如公司的分布式数据中心)各自拥有本地的不完整轨迹数据集。
  • 研究的目标是开发一个全局函数 $ F(\cdot) $,以便在不集中化数据的情况下,恢复各客户端的不完整地图匹配轨迹中的缺失坐标。

每一条不完整的轨迹都会被处理以填补数据缺口,从而重构出完整的地图匹配轨迹。函数 $ F(\cdot) $ 可能应用了联邦学习的原理,在不共享原始数据的情况下,通过分布式数据源协同训练模型。

这种方法允许多个客户端的数据共同为统一的轨迹恢复模型提供支持,同时保护数据隐私。

是的,这里的 $ p_1 $ 表示的是一个 GPS点,包含以下信息:

  • 纬度(lat)
  • 经度(lng)
  • 附加信息(γ):例如地址或其他相关信息

在文中的定义中,每个 $ p $(包括 $ p_1, p_2, \dots $)都是一个三元组 $ \langle lat, lng, \gamma \rangle \(。因此,\) p_1 $ 具体就是第一个 GPS 点的纬度、经度以及可能的附加信息。

框架

以下是包含公式详细解释的文字内容,帮助更清楚地理解 LightTR 框架中的公式和模块功能:

模块解读和公式解析

  1. Local Trajectory Preprocessing and Light Embedding

    • Local Trajectory Preprocessing:这一模块将收集的轨迹数据预处理为地图匹配的轨迹,即将 GPS 点转换为道路网络上的离散单元,通常使用隐马尔可夫模型(HMM)实现,如公式 (4) 所示:

      \[T = \text{HMM}(\tau) = \langle (g_1, t_1), \dots, (g_n, t_n) \rangle \]

      其中,$ g_i = (x_i, y_i, tid_i) $,表示轨迹点在道路网格中的坐标 $ x_i $ 和 $ y_i $,以及时间间隔信息 $ tid_i = \left\lfloor \frac{t_i - t_0}{\epsilon} \right\rfloor $,用于指导模型学习如何在两个低采样率点之间恢复轨迹点。

    • Lightweight Trajectory Embedding:使用一个轻量化的轨迹嵌入模块将轨迹 $ T $ 转换为单一向量表示,以捕捉轨迹数据的复杂时空关系。这里采用门控循环单元(GRU)进行嵌入,如公式 (5) 所示:

      \[r_t = \sigma(W_r \cdot [h_{t-1}, g_t] + b_r) \]

      \[z_t = \sigma(W_z \cdot [h_{t-1}, g_t] + b_z) \]

      \[\tilde{h}_t = \tanh(W_h \cdot [r_i \ast h_{t-1}, g_t] + b_h) \]

      \[h_t = (1 - z_t) \ast h_{t-1} + z_t \ast \tilde{h}_t \]

      其中 $ W $ 是各个门的权重矩阵,$ b $ 是偏置项,$ \sigma $ 表示 sigmoid 激活函数,$ \ast $ 表示元素乘法,$ h_t $ 是当前时间步的隐藏状态。公式 (6) 简化了嵌入模型,定义为:

    \[ h_t = \text{embedding}(h_{t-1}, s_{t-1}) \]

    表示在低采样率的轨迹嵌入中得到隐藏特征 $ h_t $。

  2. ST-blocks

    • ST-blocks 包含一个轻量化的时空操作符(ST-operator),用于同时预测道路段 $ e_t $ 和移动比例 $ r_t $。其中 ST-operator 包含一个 RNN 层和一个多任务(MT)模型,用于同时处理道路段和移动比例的预测。公式 (7) 表示 ST-operator 的过程:

      \[h'_t = \text{RNN}(h_t) \]

      \[e_t, r_t = \text{MT}(h'_t) \]

      MT 模型进一步分解为公式 (8):

      \[h_{t,d} = \text{Dense}(h'_t, W_d) = W_d \cdot h'_t + b_d \]

      \[e_t = \text{Mask}(h_{t,d}) \]

      \[h_{t,e} = \text{Emb}(h_{t,d}, e^t) = \text{ReLU}(h_{t,d} + \text{RNN}(e^t)) \]

      \[r_t = \text{ReLU}(\text{Dense}([h_{t,e}, e^t], W_r)) = W_r \cdot [h_{t,e}, e^t] + b_r \]

      其中 $ h_t $ 表示当前时刻的隐藏状态,$ W $ 和 $ b $ 分别表示权重和偏置项,ST-operator 将 $ h_t $ 传入 RNN 和多任务模型,分别得到道路段预测 $ e_t $ 和移动比例预测 $ r_t $。

    • 递归公式 (9) 表示 ST-blocks 的状态更新:

      \[h_t = \text{STBlocks}(h_{t-1}, e_{t-1}, r_{t-1}) \]

      其中 $ e_{t-1} $ 和 $ r_{t-1} $ 分别代表上一个时间步的道路段嵌入和移动比例。

  3. Constraint Mask Layer

    • 该层通过限制掩膜函数来提高模型的精确度和细粒度轨迹恢复。公式 (10) 定义了该掩膜层:

      \[c_i = \exp\left(-\frac{\text{dist}^2(p_i, \tilde{p}_i)}{\gamma}\right) \]

      其中,$ \text{dist}(p_i, \tilde{p}_i) $ 表示原始点 $ p_i $ 与地图匹配点 $ \tilde{p}_i $ 在相应道路段 $ e $ 上的欧氏距离,$ \gamma $ 是与道路网络相关的参数。该掩膜层用于降低与道路网格位置较远点的影响。
  4. Knowledge Distillation (公式 11)

    • 在知识蒸馏过程中,结合掩膜层与 softmax 函数预测轨迹的道路段。公式 (11) 表示在考虑距离约束下的概率计算:

      \[P(e_i | h_i) = \frac{\exp(h_{t,d}^T \cdot w_{c}) \circ c_i}{\sum_{c' \in C} \exp(h_{t,d}^T \cdot w_{c'}) \circ c_i} \]

      其中 $ w_c $ 为可训练的参数矩阵,$ c_i $ 为掩膜系数,用于调整预测的概率。最终通过 $ \text{argmax} $ 确定最终预测的道路段

$ e_t $。

Meta-knowledge Enhanced Local-Global Training

  • 知识蒸馏过程:如图所示,包含教师模型和学生模型。教师模型(或元学习器)在中央服务器上进行预训练,以学习元知识。然后,在本地训练过程中,客户端下载教师模型的参数,作为学生模型的指导。这一方法减少了通信成本,同时通过参数聚合更新全局模型,提升模型的准确性和训练效率。

总体而言,LightTR 框架通过分布式的联邦学习和知识蒸馏技术,结合轻量化嵌入和时空操作,实现了高效的轨迹恢复,保护了数据隐私并降低了通信开销。

标签:轨迹,cdot,text,模型,道路,数据,GPS
From: https://www.cnblogs.com/GraphL/p/18523061

相关文章

  • 数据同步rsync
    数据同步rsyncRsync本地模式和远程模式1.安装yuminstall-yrsync2.命令语法本地模式rsync参数srcdest1.对文件同步[[email protected]]#rsync-avzP/var/log/messages/tmp/sendingincrementalfilelistmessages3,311,285100%84.50MB/s......
  • 基于Django高校岗位招聘平台与数据可视化分析设计和实现
    开发语言:Python框架:djangoPython版本:python3.7.7数据库:mysql5.7(一定要5.7版本)数据库工具:Navicat11开发软件:PyCharm浏览器:谷歌浏览器后台路径地址:localhost:8080/项目名称/admin/dist/index.html前台路径地址:localhost:8080/项目名称/front/dist/index.html(无前台......
  • 缓存雪崩/穿透/击穿/失效原理图/14种缓存数据特征+10种数据一致性方案(全面篇)
    在当今数据驱动的互联网时代,缓存成为了提升应用性能的关键技术。面对海量用户请求,如何通过缓存策略有效减轻数据库压力、降低响应延迟?本文深入探讨了缓存雪崩、缓存穿透、缓存击穿等常见问题,并提供了全面的解决方案。通过实际案例分析,揭示了缓存设计的最佳实践,确保数据一致......
  • Redis数据结构:List类型全面解析
    文章目录一、List数据类型1.1简介1.2应用场景1.3底层结构二、数据结构2.1压缩列表ZipList2.2双向链表LinkedList(后续已废弃)2.3快速链表QuickList三、List常见命令一、List数据类型1.1简介详细介绍:Redis五种数据类型、String、List、Set、Hash、ZSetRedis......
  • 【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
    ......
  • 达梦DM-统计用户下每个表的行数和数据量大小
    1,统计用户下每个表的行数和数据量大小–创建一张临时表,用来记录每张表的数据量情况createtabletable_count(ownervarchar(100),table_namevarchar(100),cntint);–执行存储过程统计指定模式每张表数据条数模式名改为要查询的对应的模式即可declarev_ownerVARCHAR2(100)......
  • 启动内置数据库
    sudodockerrun-itd-p3306:3306\-eMYSQL_ALLOW_EMPTY_PASSWORD="root"\--namemysql\-dregistry.cn-hangzhou.aliyuncs.com/ykd_project/mysql:8.0\--character-set-server=utf8\--collation-server=utf8_general_ci\......
  • SpringBoot外语学习系统vvp4z程序+源码+数据库+调试部署+开发环境
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、课题名称外语学习系统的研发与优化二、研究目的与意义随着全球化的不断深入,外语学习的重要性日益凸显。一个高效、个性化的外语学习系统能够......
  • SpringBoot图书管理信息系统6fh8g程序+源码+数据库+调试部署+开发环境
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、课题名称图书管理信息系统的开发与应用二、选题意义随着信息技术的飞速发展,图书馆作为知识和信息的集散地,其管理效率和服务水平直接影响到读......
  • SpringBoot图片销售网站e4a32--(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容一、研究背景随着互联网技术的快速发展,图片已成为人们日常生活中不可或缺的元素。无论是社交媒体、广告宣传,还是个人创作,都需要用到大量高质量的图......