[ICDE 2022]How Learning Can Help Complex Cyclic Join Decomposition
总结
主要贡献是把子图匹配策略的cost的判断改为了GNN实现的预测(写得挺模棱两可的)
动机
解决子图匹配的一个重要问题是解决复杂循环连接查询。文章除了在工程方面提供了GUI,主要的贡献是设计了合理的框架,使用AI更好地解决了复杂循环连接查询。
问题定义
实现有点、边标签的图的子图匹配
框架
用户的查询扔进来之后会先进行解析,把所有点都视为一个自循环查询(?),然后使用GHD(广义超树分解)将解析结果分解成无循环连接的树。GHD部分将使用AI强化(LSS)。最后,评估计算最佳的计划,也就是用那棵树。
比如图2(a),其中的每条边都是超边。GHD的目标就是将这个循环超图转为树(b)(前面不是说无循环吗?)
模型的训练目标就是用GNN和MSE去拟合每一组树的cost。(ground truth怎么来的?如何一一对应?)
数据集
实验
评估指标是Q-Error,基本意思是判断估计的cost和实际cost之间的差距。
SOTA是一篇17年的文章,不涉及AI。相当于是在已有的AGM上增加了一层AI的cost预测来辅助选择匹配策略。(AGM原文没有任何实验)