Here's the organized markdown text for LightTR: A Lightweight Framework for Federated Trajectory Recovery.
LightTR: A Lightweight Framework for Federated Trajectory Recovery
数据形式
根据提供的图片,这项研究的主题是关于联邦轨迹恢复问题,主要涉及GPS轨迹数据。以下是数据和任务的总结:
使用的数据
- 道路网络:表示为一个有向图 $ G = (V, E) $,其中 $ V $ 表示道路的交叉口或终点,$ E $ 表示有向道路段。
- GPS点:包含纬度、经度和附加属性(如时间戳)的点,表示为 $ \langle lat, lng, \gamma \rangle $。
- 不完整轨迹:由一些GPS点组成的序列,其中部分数据缺失,表示为原始或不完整轨迹 $ \tau = \langle (p_1, t_1), (p_2, t_2), \dots, (p_n, t_n) \rangle $。
- 地图匹配轨迹:将GPS轨迹投影到道路网络上的过程,通过已知的道路路径来校准GPS点,从而减少原始GPS数据中的噪声或误差。
- 不完整地图匹配轨迹:类似于地图匹配轨迹,但其中包含一些缺失点,需要进行补全。
任务
联邦轨迹恢复问题的目标是恢复缺失的GPS轨迹数据。在这个框架中:
- 多个客户端(如公司的分布式数据中心)各自拥有本地的不完整轨迹数据集。
- 研究的目标是开发一个全局函数 $ F(\cdot) $,以便在不集中化数据的情况下,恢复各客户端的不完整地图匹配轨迹中的缺失坐标。
每一条不完整的轨迹都会被处理以填补数据缺口,从而重构出完整的地图匹配轨迹。函数 $ F(\cdot) $ 可能应用了联邦学习的原理,在不共享原始数据的情况下,通过分布式数据源协同训练模型。
这种方法允许多个客户端的数据共同为统一的轨迹恢复模型提供支持,同时保护数据隐私。
是的,这里的 $ p_1 $ 表示的是一个 GPS点,包含以下信息:
- 纬度(lat)
- 经度(lng)
- 附加信息(γ):例如地址或其他相关信息
在文中的定义中,每个 $ p $(包括 $ p_1, p_2, \dots $)都是一个三元组 $ \langle lat, lng, \gamma \rangle \(。因此,\) p_1 $ 具体就是第一个 GPS 点的纬度、经度以及可能的附加信息。
框架
以下是包含公式详细解释的文字内容,帮助更清楚地理解 LightTR 框架中的公式和模块功能:
模块解读和公式解析
-
Local Trajectory Preprocessing and Light Embedding
-
Local Trajectory Preprocessing:这一模块将收集的轨迹数据预处理为地图匹配的轨迹,即将 GPS 点转换为道路网络上的离散单元,通常使用隐马尔可夫模型(HMM)实现,如公式 (4) 所示:
\[T = \text{HMM}(\tau) = \langle (g_1, t_1), \dots, (g_n, t_n) \rangle \]其中,$ g_i = (x_i, y_i, tid_i) $,表示轨迹点在道路网格中的坐标 $ x_i $ 和 $ y_i $,以及时间间隔信息 $ tid_i = \left\lfloor \frac{t_i - t_0}{\epsilon} \right\rfloor $,用于指导模型学习如何在两个低采样率点之间恢复轨迹点。
-
Lightweight Trajectory Embedding:使用一个轻量化的轨迹嵌入模块将轨迹 $ T $ 转换为单一向量表示,以捕捉轨迹数据的复杂时空关系。这里采用门控循环单元(GRU)进行嵌入,如公式 (5) 所示:
\[r_t = \sigma(W_r \cdot [h_{t-1}, g_t] + b_r) \]\[z_t = \sigma(W_z \cdot [h_{t-1}, g_t] + b_z) \]\[\tilde{h}_t = \tanh(W_h \cdot [r_i \ast h_{t-1}, g_t] + b_h) \]\[h_t = (1 - z_t) \ast h_{t-1} + z_t \ast \tilde{h}_t \]其中 $ W $ 是各个门的权重矩阵,$ b $ 是偏置项,$ \sigma $ 表示 sigmoid 激活函数,$ \ast $ 表示元素乘法,$ h_t $ 是当前时间步的隐藏状态。公式 (6) 简化了嵌入模型,定义为:
表示在低采样率的轨迹嵌入中得到隐藏特征 $ h_t $。
-
-
ST-blocks
-
ST-blocks 包含一个轻量化的时空操作符(ST-operator),用于同时预测道路段 $ e_t $ 和移动比例 $ r_t $。其中 ST-operator 包含一个 RNN 层和一个多任务(MT)模型,用于同时处理道路段和移动比例的预测。公式 (7) 表示 ST-operator 的过程:
\[h'_t = \text{RNN}(h_t) \]\[e_t, r_t = \text{MT}(h'_t) \]MT 模型进一步分解为公式 (8):
\[h_{t,d} = \text{Dense}(h'_t, W_d) = W_d \cdot h'_t + b_d \]\[e_t = \text{Mask}(h_{t,d}) \]\[h_{t,e} = \text{Emb}(h_{t,d}, e^t) = \text{ReLU}(h_{t,d} + \text{RNN}(e^t)) \]\[r_t = \text{ReLU}(\text{Dense}([h_{t,e}, e^t], W_r)) = W_r \cdot [h_{t,e}, e^t] + b_r \]其中 $ h_t $ 表示当前时刻的隐藏状态,$ W $ 和 $ b $ 分别表示权重和偏置项,ST-operator 将 $ h_t $ 传入 RNN 和多任务模型,分别得到道路段预测 $ e_t $ 和移动比例预测 $ r_t $。
-
递归公式 (9) 表示 ST-blocks 的状态更新:
\[h_t = \text{STBlocks}(h_{t-1}, e_{t-1}, r_{t-1}) \]其中 $ e_{t-1} $ 和 $ r_{t-1} $ 分别代表上一个时间步的道路段嵌入和移动比例。
-
-
Constraint Mask Layer
- 该层通过限制掩膜函数来提高模型的精确度和细粒度轨迹恢复。公式 (10) 定义了该掩膜层:\[c_i = \exp\left(-\frac{\text{dist}^2(p_i, \tilde{p}_i)}{\gamma}\right) \]其中,$ \text{dist}(p_i, \tilde{p}_i) $ 表示原始点 $ p_i $ 与地图匹配点 $ \tilde{p}_i $ 在相应道路段 $ e $ 上的欧氏距离,$ \gamma $ 是与道路网络相关的参数。该掩膜层用于降低与道路网格位置较远点的影响。
-
Knowledge Distillation (公式 11)
- 在知识蒸馏过程中,结合掩膜层与 softmax 函数预测轨迹的道路段。公式 (11) 表示在考虑距离约束下的概率计算:\[P(e_i | h_i) = \frac{\exp(h_{t,d}^T \cdot w_{c}) \circ c_i}{\sum_{c' \in C} \exp(h_{t,d}^T \cdot w_{c'}) \circ c_i} \]其中 $ w_c $ 为可训练的参数矩阵,$ c_i $ 为掩膜系数,用于调整预测的概率。最终通过 $ \text{argmax} $ 确定最终预测的道路段
$ e_t $。
Meta-knowledge Enhanced Local-Global Training
- 知识蒸馏过程:如图所示,包含教师模型和学生模型。教师模型(或元学习器)在中央服务器上进行预训练,以学习元知识。然后,在本地训练过程中,客户端下载教师模型的参数,作为学生模型的指导。这一方法减少了通信成本,同时通过参数聚合更新全局模型,提升模型的准确性和训练效率。
总体而言,LightTR 框架通过分布式的联邦学习和知识蒸馏技术,结合轻量化嵌入和时空操作,实现了高效的轨迹恢复,保护了数据隐私并降低了通信开销。
标签:轨迹,cdot,text,模型,道路,数据,GPS From: https://www.cnblogs.com/GraphL/p/18523061