首页 > 其他分享 >Vineyard 论文被 SIGMOD'2023 接收,助力计算引擎之间高效数据交换

Vineyard 论文被 SIGMOD'2023 接收,助力计算引擎之间高效数据交换

时间:2023-03-07 11:35:11浏览次数:40  
标签:SIGMOD Vineyard 引擎 计算 2023 v6d

Vineyard (CNCF sandbox 项目)是脱胎于 GraphScope 底层存储、用于在复杂工作流中不同计算引擎之间进行高效数据交换的中间件,该工作的论文被数据库领域顶级学术会议 SIGMOD 2023 接收录用。

近日,CCF-A 类学术会议、数据库领域最为优秀的学术会议之一的 SIGMOD 2023(The 42nd ACM SIGMOD International Conference on Management of Data)Industrial Track 结果揭晓,致力于不同计算引擎之间进行高效数据交互的项目 Vineyard (v6d) 被成功接收!

Vineyard: Optimizing Data Sharing in Data-Intensive Analytics. Wenyuan Yu, Tao He, Lei Wang, Ke Meng, Ye Cao, Diwen Zhu, Sanhong Li, Jingren Zhou. The 42nd ACM International Conference on Management of Data (SIGMOD), Seattle, Washington, USA, June 2023.

真实的生产环境存在着大量的复杂的分析型作业:单个作业中包含若干子任务,而各个子任务可能属于不同的计算类型(例如 SQL、深度学习、图计算)。为了处理这些复杂的作业,往往将每个子任务分配到某个特定的计算引擎(例如将图计算任务分配到 GraphScope,将深度学习任务分配到 PyTorch)。为了在不同计算引擎之间进行中间结果的交换,目前通用的做法是将中间结果以文件的形式存储到外部存储中(例如本地磁盘、S3 和 OSS),但是这个过程会导致巨大的数据序列化/反序列化、I/O等开销,从而拖慢整个作业的执行时间。我们发现尽管不同的计算引擎往往对同一数据结构(例如 DataFrame、HashMap)有不同的实现,但是同一数据结构的接口则基本保持一致,而计算引擎的计算逻辑往往只关注数据结构提供的接口而非接口的具体实现。

基于这个观察,我们设计了 Vineyard (v6d),它允许用户向 v6d 注册自己的数据结构,在计算引擎与 v6d 中的数据结构进行对接后,计算引擎产生的中间结果以高层的 object 分享,使得计算引擎可以通过内存映射(memory mapping)和方法共享(method sharing)高效地进行数据分享。同时,为了降低计算引擎与 v6d 的集成难度,v6d 针对跨编程语言的计算引擎进行了针对性的优化。在真实数据集和作业中,v6d 与传统的通过文件和外部存储进行数据交换的方案相比,能够取得最高 68.4 倍的加速。

Vineyard 目前已经开源,并成为 CNCF sandbox 项目,点击此处即可获得 Vineyard 的进一步介绍和详细的文档以及源码。

标签:SIGMOD,Vineyard,引擎,计算,2023,v6d
From: https://www.cnblogs.com/alisystemsoftware/p/17187449.html

相关文章

  • 《渗透测试》抓包技术&HTTPS协议&APP&小程序&PC应用&WEB&转发联动 2023 day6&7
      准备工作:1、浏览器安装证书:解决本地抓HTTPS1.1打开burpsuite的Proxy模块   1.2点击下方的import/exportCAcertificate选择输出的第一个按钮 1.3......
  • 2023-03-07 `defaultValue` is invalid for `getFieldDecorator` will set `value`, p
    `defaultValue`isinvalidfor`getFieldDecorator`willset`value`,pleaseuse`option.initialValue`instead.`defaultValue`对于`getFieldDecorator`无效。如果要......
  • 116、tail+grep命令——2023年3月7日10:01:06
    2023年2月20日14:50:371、tail基本命令tail命令.因为查看日志通常从后面最新的日志去看,tail命令就是从后往前找.比如下述命令会显示access.log的最后10行的内......
  • C/C++教师工资管理系统[2023-03-06]
    C/C++教师工资管理系统[2023-03-06]题目描述:每个教师的月工资信息为:教师号、姓名、性别、单位名称、联系电话、基本工资、津贴、生活补贴、应发工资、电话费、水电费、房......
  • 2023/3/6
    今天建民老师在课上给我们出了一道求数组子数组最大和的题目,冥思苦想了许久都没有想出来,听到其他同学讲解的一个思路是定义三个数组,第一个数组存储原数组,第二个数组存储数......
  • 2023/3/6
    安卓系统的画中画功能是一项非常实用的功能。该功能可让用户在观看视频或进行视频通话时同时进行其他操作,如查看邮件或发送消息。使用该功能只需在支持画中画的应用中启用......
  • 2023/3/6每日随笔
    今天上午上了工程数学,学的主要是搜索,学到了0.618直接搜索,还有一些其他的搜索,就是有点听不懂,然后下午上了建民老师的课,了解了一个优秀程序员的素质,然后对于AndriodStudio的......
  • 每日总结_20230306
    今天我学习了Javaweb中的Servlet和JSP,了解了Servlet的生命周期、请求和响应过程等概念,掌握了使用JSP进行动态网页开发的方法。同时,我也学习了使用Tomcat服务器进行Javaweb......
  • 2023年如何在Google做外贸
    2023年如何在Google做外贸答案是:利用谷歌SEO获取自然流量促进成交。随着全球化和数字化的发展,外贸行业越来越重视互联网的渠道拓展。在Google搜索引擎上做好SEO优化,是吸引国......
  • 2023年小程序游戏发展前景分析
    随着移动互联网时代的到来,越来越多的人参与了小程序开发。目前根据《2022微信小游戏增长白皮书》,微信小游戏开发人员人数已超过10万人。今天就来一起聊聊小程序游戏未来的发......