首页 > 其他分享 >基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录

基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录

时间:2023-08-18 11:36:02浏览次数:44  
标签:Rover 字节 数智 跳动 KDD 火山 引擎 收录

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群


基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录

近期,第29届国际知识发现与数据挖掘大会(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,以下简称KDD)在美国加州长滩举办。由火山引擎数智平台,北京大学计算机学院和蒙特利尔学习算法研究所等单位合作的论文 Rover: An online Spark SQL tuning service via generalized transfer learning (以下简称Rover)成功被大会收录。Rover由北京大学的沈彧和火山引擎数智平台的任鑫宇杨担任共同第一作者,北京大学的崔斌教授担任通讯作者。

基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录_ab测试

图1:论文题目和作者信息

KDD会议始于1989年,是数据挖掘领域历史最悠久、影响最大的顶级学术年会。KDD广泛的交叉学科性和应用性吸引了来自统计、机器学习、数据库、万维网、生物信息学、多媒体、自然语言处理、人机交互、社会网络计算、高性能计算及大数据挖掘等众多领域的研究者,为来自学术界、企业界和政府部门的相关人员提供了一个学术交流和成果展示的理想场所。

Apache Spark作为主流的分布式计算框架,在工业界得到了广泛的应用,字节跳动内部庞大的例行计算任务每天消费数百万core CPU及数十PB RAM规模的计算资源。每个Spark任务通过200余个相互关联的配置参数启动,但是,由于平台默认配置缺乏弹性,任务环境多样,终端用户经验不足等问题,相当数量的计算资源常因不合理的配置而被浪费。传统上,有经验的大数据工程师可以依据每个任务的运行情况,对其配置进行人工分析和调整。然而,这种人工调优方式在面临在高维参数组合时往往难以奏效,并伴有运维迭代成本高昂等问题,使得其难以被规模化。

为了解决此问题,火山引擎的工程师和北京大学的研究者一起设计了一种结合机器学习方法与人类专家知识的基础设施成本优化框架(如图2所示),该框架以贝叶斯优化算法为基础,使用高斯过程作为代理模型学习配置参数集与任务成本/运行时长的关系,并通过可信赖的迁移学习机制,从人类专家知识编码中获得安全性和可解释性(如图2中Expert-assisted Optimization部分所示),并从相似的历史任务中获得额外的收敛加速特性(如图2中Controlled History Transfer部分所示)。

基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录_数据挖掘_02

图2:Rover优化器的整体架构

该方案能自动化识别和调整例行计算任务的配置参数集,在不破坏任务服务等级的前提下压缩资源浪费,有效节省运行成本。经验证,Rover在公开任务集及字节跳动内部的实际部署中,对比当前业内领先的解决方案,在极限收益,收敛速度和安全性方面均有进一步提升。

基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录_数据挖掘_03

图3: 对比4种业内领先的解决方案,Rover在公开任务集上的内存节约比例更为显著

Rover是基于火山引擎DataTester在字节跳动内部应用的自动调参系统优化器内核、增加迁移学习机制演化而来,并通过自动调参平台的配套服务来实施和运行的,目前该项研究已经在字节跳动上万个Spark数据开发任务上得到应用,已帮助公司节约700万元/年的资源成本。未来,这项技术将在字节跳动内部的大数据计算基础设施上大规模部署,预计每年将会节约近十亿元,还将通过火山引擎数智平台为外部企业提供通用优化器服务,可应用于基础设施成本优化,线上算法超参数优化等多种场景。

据了解,火山引擎数智平台(VeDI)是新一代企业数据智能服务平台,旗下的A/B测试产品DataTester经历了字节跳动的10年打磨,目前服务于字节跳动内部500余个业务线,也服务了包括美的、得到、凯叔讲故事等在内的上百家外部企业,为企业业务的用户增长、转化、产品迭代、运营活动等各个环节提供科学的决策依据,将成熟的“数据驱动增长”经验赋能给各行业。


点击跳转火山引擎A/B测试了解更多


标签:Rover,字节,数智,跳动,KDD,火山,引擎,收录
From: https://blog.51cto.com/bytedata/7133057

相关文章

  • 基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 基于迁移学习的基础设施成本优化框架,火山引擎数智平台与北京大学联合论文被KDD收录近期,第29届国际知识发现与数据挖掘大会(ACMSIGKDDConferenceonKnowledgeDiscoveryandDataMin......
  • 百望云联合华为发布票财税链一体化数智解决方案 赋能企业数字化升级
    随着数据跃升为数字经济关键生产要素,数据安全成为整个数字化建设的重中之重。为更好地帮助企业发展,中央及全国和地方政府相继出台了多部与数据相关的政策法规,鼓励各领域服务商提供具有自主创新的软件产品与服务,帮助企业在合规的前提下,完成数字化建设的提档加速。 基于此,百望云与华......
  • nginx or apache前端禁收录,爬虫,抓取
    一、Nginx规则直接在server 中新增如下规则即可:##################################################禁止蜘蛛抓取动态或指定页面规则By##################################################server{listen80;server_namezhangge.net;indexindex.htmlindex.......
  • 加强预算管理一体化,走进全面预算管理的数智化时代
    自2021年,国务院印发《国务院关于进一步深化预算管理制度改革的意见》(国发〔2021〕5号)以来,中央政府对企业实施全面预算管理越来越重视,预算绩效管理逐渐进入大家的视线。各个企业逐步落实应用,推进预算管理一体化系统,加快建立完善的企业绩效管理制度,提升预算管理的标准化、规范化和信......
  • 1MKDd_5Ml
    在生活的道路上,我们难免会遇到一些棘手的问题,其中之一就是:当朋友向我们借钱时,我们该如何应对?这个问题涉及到的不仅仅是金钱,还有友情、信任、责任等多个维度。在这篇文章中,我将以我自己的经历为基础,分享一些关于这个问题的个人见解和思考。第一部分:记录——铸造信任的基石首先,无......
  • 企业税务数智化趋势
        税务数智化使能企业从税务操作走向税务管理在传统的税务管理方式下,企业税务管理团队绝大多数人员、绝大部分时间花在销项开票、进项认证、各税种纳税申报等日常操作场景,仅有少量时间做税务风险管控、税务筹划和业财对接等税务管理事宜。税务数智化转型可以大幅提升税务......
  • 杭钢集团:用友iuap为数智底座的数智化转型之路
    杭州钢铁集团有限公司(简称“杭钢集团”)是一家以数字科技、节能环保、钢铁智造、现代流通“四轮驱动”为重点的大型现代企业集团。该集团创建于1957年,经过66年的发展,已成为一家在浙江省属重点骨干企业中具有较高地位和影响力的大型企业集团。进入新时代,杭州钢铁集团有限公司根据省国......
  • 用支付宝小程序云数智营销,助力商家增长
    7月7日,支付宝小程序云发布会在上海成功举办。作为业务负责人,侯仁鹏在会上为我们带来了《数智营销助力商家增长》的主题分享。会上重点介绍了支付宝小程序云在私域搜索、私域推荐、小程序橱窗、私域画像等智能营销方向的产品升级,帮助商家实现持续性、精细化的用户运营,促进用户增长、......
  • .NET Core框架、库和软件的中文收录大全
    .NETCore框架、库和软件的中文收录大全。内容包括:库、工具、框架、模板引擎、身份认证、数据库、ORM框架、图片处理、文本处理、机器学习、日志、代码分析、教程等。这里记录的大部分可以链接到github上,Nuget上也有对应的包,这里只记录比较牛的项目。目录微软ORMIOC日志......
  • 计讯物联3.0智慧灯杆网关TG473,创造智慧城市“数智”美好
    基于5G、物联网、智能传感、大数据、人工智能等新兴技术趋向于成熟,我国智慧城市规模发展迅速,并得到广泛的实施应用。除了技术层面,政策扶持对于智慧城市的建设也具有重大意义。今年的政府工作报告明确指出,要建设数字信息基础设施,推进5G规模化应用,促进产业数字化转型,发展智慧城市。......