LT-OCF: Learnable-Time ODE-based Collaborative Filtering

时间：2022-11-23 17:56:43浏览次数：84

标签：Filtering based Collaborative bm OCF LT tilde theta rightarrow

概
符号说明
本文方法
代码

Choi J., Jeon J. and Park N. LT-OCF: Learnable-time ode-based collaborative filtering. In International Conference on Information and Knowledge Management (CIKM), 2021.

概

把 LightGCN 抽象为一个 ODE 问题, 然后通过更灵活的可学习的 \(t\) 来构建 LT-OCF.

符号说明

\(|\mathcal{U}| = N, |\mathcal{I}|=M\);
\(E_i^u \in \mathbb{R}^{N \times D}, E_i^p \in \mathbb{R}^{M \times D}\) 分别为用户和产品在第 i 层的特征;
用 \(\tilde{A}_{p \rightarrow u}\) 表示产品到用户的聚合, 类似地可以定义 \(\tilde{A}_{u \rightarrow p}\);
对于微分方程 (ODE)

\[\bm{h}(t) = \bm{h}(0) + \int_0^t f(\bm{h}(t), t; \theta) dt, \]
1. 我们可以通过 Euler 方法来从 \(\bm{h}(0)\) 逐步逼近到 \(\bm{h}(T)\):
  
  \[\bm{h}(t + s) = \bm{h}(t) + s \cdot f(\bm{h}(t), t; \theta), \]
  这里每一步的步长为 \(s\).
2. 也可以用比如 fourth-order Runge–Kutta (RK4) 来近似 \(\bm{h}(T)\):
  
  \[\bm{h}(t + s) = \bm{h}(t) + \frac{s}{6}(f_1 + 2f_2 + 2f_3 + f_4), \\ f_1 = f(\bm{h}(t), t; \theta), \\ f_2 = f(\bm{h}(t) + \frac{s}{2}f_1, t + \frac{s}{2}; \theta), \\ f_3 = f(\bm{h}(t) + \frac{s}{2}f_2, t + \frac{s}{2}; \theta), \\ f_4 = f(\bm{h}(t) + sf_3, t + s; \theta). \\ \]

本文方法

对于 LightGCN, 它实际上是如下方程的一个特例:

\[\bm{u}(K) = \bm{u}(0) + \int_{0}^K f(\bm{p}(t)) dt, \\ \bm{p}(K) = \bm{p}(0) + \int_{0}^K g(\bm{u}(t)) dt. \\ \]
其中 \(f(\bm{p}) = \tilde{A}_{p \rightarrow u} \bm{p}, g(\bm{u}) = \tilde{A}_{u \rightarrow p} \bm{u}.\)
特别的, 采用步长为 \(1\) 的 Euler 迭代可得:

\[\bm{u}(i + 1) = \bm{u}(i) + \tilde{A}_{p \rightarrow u} \bm{p}(i), \\ \bm{u}(i + 1) = \bm{u}(i) + \tilde{A}_{u \rightarrow p} \bm{p}(i). \\ \]
这实际上就是添加了 self-loops 的 LightGCN.
但是作者认为, 采取 \(s=1\) 这种固定步长不是很灵活的选择, 作者希望将整个过程分解为:
然后其中 \(t_1, \cdots, t_T\) 是可以训练的参数, 如此一来我们就可以对整个方程解的更好了.
最后

\[E_{final}^u = \sum_{i=0}^K w_i \bm{u}(t_i), \\ E_{final}^p = \sum_{i=0}^K w_i \bm{p}(t_i). \]

注: LT-OCF 包含 embeddings 和 \(t\) 两个可以训练的部分, 这些都是用 Adam 训练的. 特别的是, 数值求解微分方程的部分用在更精细地求解每个子问题 \((t_i, t_{i+1}]\) 上去了.

注: 作者虽然用 Adam 更新 \(t\), 但每一次训练后还要调整 \(t\) 使得其在合理的范围内.

注: 作者用的数值求解库为 torchdiffeq.

代码

[official]

标签：Filtering,based,Collaborative,bm,OCF,LT,tilde,theta,rightarrow
From： https://www.cnblogs.com/MTandHJ/p/16919203.html

玻尔兹曼分布详细推导、softmax 及 Energy Based Model
大多数人应该都是在利用神经网络解分类问题时第一次接触softmax，对它的印象也只停留在把实数域的输出转换为合法的概率分布这里，本文介绍softmax的本源——玻尔兹曼分布......
[WSDM 2022]An Effective Graph Learning based Approach for Temporal Link Predicti
[WSDM2022]AnEffectiveGraphLearningbasedApproachforTemporalLinkPrediction:TheFirstPlaceofWSDMCup2022总结传统模型+拓扑结构中生成更多的特征实现......
A Deep Learning Scheme for Detecting Atrial Fibrillation Based on Fusion of Raw
ADeepLearningSchemeforDetectingAtrialFibrillationBasedonFusionofRawandDiscreteWaveletTransformedECGFeatures|IEEEConferencePublication|I......
【论文笔记】CBIR的最近发展 - Recent developments of content-based image retrieva
原文地址Abstract随着互联网技术的发展和数字设备的普及，基于内容的图像检索(Content-BasedImageRetrieval,CBIR)迅速的发展、应用，涉及计算机视觉和人工智能的各个......
2019 Non-Profiled Deep Learning-based Side-Channel attacks with Sensitivity Anal
一、引言侧信道分析可以分为建模类攻击（模板攻击和随机方法）和非建模类攻击（DPA、CPA和互信息分析）进行建模类侧信道攻击需要目标设备和建模设备攻击者对目标设备由有限......
2022 Deep Learning-Based Side-Channel Analysis Against AES Inner Rounds
一、引言1CPA将能量迹和观察到的泄露（泄露模型包括HW、HD）关联2深度学习方法DL-SCA在预处理和攻击效果上优于其它建模类攻击，它将能量迹和标签在建模阶段结合起来，在......
【Deep Learning Based On PyTorch】神经网络介绍
神经网络概念人工神经网络（简称神经网络），是一种模仿生物神经网络的结构和功能的数学模型，用于对函数进行估计或近似。和其它的机器学习方法一样，神经网络已经被用于解决各......
【Deep Learning Based On PyTorch】简介
深度学习深度学习是机器学习的分支，是以人工神经网络为基础，对数据的特征进行学习的方法。机器学习与深度学习的区别a.特征的提取：机器学习是人工提取，深度学习是自动提取......
SpringBoot启动报错The APR based Apache Tomcat Native..
SpringBoot项目启动报错TheAPRbasedApacheTomcatNativel...一、报错信息2022-11-1009:50:53org.apache.catalina.core.AprLifecycleListenerinit信息:TheAP......
DeepBurning: automatic generation of FPGA-based learning accelerators for the ne
TitleDeepBurning:automaticgenerationofFPGA-basedlearningacceleratorsfortheneuralnetworkfamilyProceedingsofthe53rdAnnualDesignAutomationCon......

LT-OCF: Learnable-Time ODE-based Collaborative Filtering

概

符号说明

本文方法

代码

相关文章

赞助商

阅读排行