首页 > 其他分享 >字节跳动基础架构两篇论文入选 VLDB 2024

字节跳动基础架构两篇论文入选 VLDB 2024

时间:2024-06-12 18:03:21浏览次数:19  
标签:字节 数据库 论文 VLDB 2024 跳动 基础架构

2024 年 8 月 26 至 30 日,VLDB 2024 将在中国广州举行。字节跳动基础架构云原生中间件团队、批式计算团队研究成果分别被 VLDB 2024 接收,并受邀进行现场报告。

VLDB(International Conference on Very Large Data Bases)是数据库三大国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。自 1975 年成立以来,每年吸引全球顶级研究机构投稿,但录用率较低,对系统创新性、完整性、实验设计等方面都要求极高。VLDB 也因此成为数据库管理领域最杰出的研究和发展成果的实时传播场所,反映了当前数据库研究的前沿方向、工业界的最新技术和各国的研发水平。

ResLake: Towards Minimum Job Latency and Balanced Resource Utilization in Geo-distributed Job Scheduling

ResLake 是字节跳动基础架构计算和存储团队、应用研究中心和系统部网络团队,共同研发的多机房计算、存储、网络一体化资源管理系统。ResLake 既能兼顾作业完成时间(Job Completion Time, JCT),又能兼顾不同机房之间资源的负载均衡。ResLake 具备资源的全局视角,通过作业调度、数据调度、网络管控等手段,能显著优化计算和存储的排布,并有效降低运营成本。ResLake 上线后,作业平均 JCT 时间降低了 20%,机房间资源利用率均衡性提升了 53%,跨机房流量降低了 50%,并降低了46% 的存储成本。

Towards Resource Efficiency: Practical Insights into Large-Scale Spark Workloads at ByteDance

Spark 在字节跳动内部主要用来做大数据离线处理,日均运行百万级别的 Spark 作业,Shuffle 量高达 500 PB,CPU 资源需求达到千万核心级别。底层计算资源包括稳定资源和在离线混部资源。在追求降本增效的背景下,如何提高上述大规模 Spark 作业的资源使用效率是一个重大挑战。

为应对这一挑战,字节跳动基础架构批式计算和应用研究中心团队与上海交通大学的数据通信与数据工程实验室合作,基于线上的实际情况从三个方面进行了系统性的优化,包括多机制的 Shuffle 优化(稳定资源 External Shuffle Service 增强、混部资源自研 Remote Shuffle Service CSS)、细粒度的资源申请和运行时资源使用控制、规则+算法两个阶段的自动参数调优。在大规模上量 50w+ 作业中,日均可节省百万级 CPU 核、PB 级内存。

CSS 开源地址:

https://github.com/bytedance/CloudShuffleService

以上论文与现场报告将于 8 月底正式亮相 VLDB 2024。届时,字节跳动基础架构团队也将发布相关论文的对应解读文章,敬请持续关注。


往届VLDB论文解读

标签:字节,数据库,论文,VLDB,2024,跳动,基础架构
From: https://blog.csdn.net/weixin_46399686/article/details/139633293

相关文章

  • 202406-如何使用新版本的rclone在服务器上挂载onedrive e5
    前情提要:这位老哥里面写的教程,因为rclone更新了所以有点不一样了,仅作记录在本地(带浏览器)操作Noremotesfound,makeanewone?n)Newremotes)Setconfigurationpasswordq)Quitconfign/s/q>nEnternamefornewremote.name>odOptionStorage.Typeofstorage......
  • React常见面试题(2024最新版)
    创建项目npxcreate-react-appmy-app启动项目npmstart目录结构目录/文件名描述README.md项目的自述文件node_modules/项目依赖包存放目录package.json包管理配置文件,记录项目信息和依赖package-lock.json锁定依赖版本,确保跨环境一致性pub......
  • 根据文件名快速搜索本地磁盘文件 2024年6月12日
      根据文件名快速搜索本地磁盘文件2024年6月12日            由于在用FileLocatorPro或者Archivarius3000对本地磁盘电脑硬盘中的文档表格进行全文搜索文件正文内容时需要预先索引,然而全文索引会占用大量的宝贵时间和磁盘存储空间,所以,我平......
  • 2024/6/12高一高考集训欢乐赛题解
    目录赛时榜T1.Efim与奇怪的成绩T2.美丽的IP地址赛时榜你说得对,但是安禄山进长安——\(\huge{唐完了}\)。T1.Efim与奇怪的成绩贪心题+小模拟。先说结论:从小数点往后找到第一个可以四舍五入的位置,然后开始四舍五入。证明:首先,小数位数靠后的如果四舍五入,收益肯定是没前面的......
  • 2024年,计算机相关专业还值得选择吗?
            选择专业是一个个人决策,它取决于多种因素,包括个人兴趣、职业目标、市场需求和行业趋势。计算机科学和相关专业在2024年仍然是一个非常有前景的选择,原因如下:技术发展:计算机科学和技术是快速发展的领域,新技术和应用不断涌现,如人工智能、机器学习、大数据、云......
  • Photoshop 2024 mac/win版:探索图像处理的全新境界
    Photoshop2024是Adobe推出的最新图像处理与设计软件,它在继承了前作所有优秀特性的基础上,实现了多个方面的质的飞跃。这款软件凭借其卓越的图像处理性能、丰富的创意工具以及精确的选区编辑功能,成为了图像处理领域的佼佼者。→→↓↓载Photoshop2024mac/win版 在功能上,Phot......
  • 2024.06.02《构建之法》阅读笔记
    在以往自己书写代码的时候,每次完成一个小功能都要自己来测试一下,但是这样做的救过并不理想。因为自己写的软件,一些自己可以想到的方面都进行了解决,而一些不能解决的问题是测试也不能够解决的。但是这样写好的程序还有没有BUG呢?而且只写BUG是否容易出现?是否能够解决呢?所以,这时就应......
  • 2024.06.03
    importosimportopenpyxlimportdatetimefromtkinterimport*fromtkinterimportmessagebox#Createthemainwindowjzr=Tk()jzr.title('个人账本记录')jzr.geometry('400x600')jzr.config(bg='lightyellow')#Createatextboxtodisplay......
  • 2024.06.04《个人总结》
      (大二下)课程总结——软件工程 1)回顾你的课程计划(第一周的计划),你完成的程度如何?请列出具体数据和实际例子。  1.你在这门课的计划是什么?参考一些学校的教学,你对这个课程有什么期待?你打算怎样度过这个课程?    计划就是尽力跟上建民老师的节奏同时,还能主动学习......
  • 2024.06.05
    【题目描述】编写程序,使用牛顿迭代法求方程在x附近的一个实根。【练习要求】请给出源代码程序和运行测试结果,源代码程序要求添加必要的注释。【输入格式】请在一行中输入方程系数a、b、c、d和实数x,数据中间以空格为间隔。【输出格式】对每一组输入的数据,输出牛顿迭代法求出的实根(......