首页 > 其他分享 >多云架构,JuiceFS 如何实现一致性与低延迟的数据分发

多云架构,JuiceFS 如何实现一致性与低延迟的数据分发

时间:2025-01-10 15:11:22浏览次数:1  
标签:分发 同步 缓存 区域 镜像 JuiceFS 数据 多云

随着大模型的普及,GPU 算力成为稀缺资源,单一数据中心或云区域的 GPU 资源常常难以满足用户的全面需求。同时,跨地域团队的协作需求也推动了企业在不同云平台之间调度数据和计算任务。多云架构正逐渐成为一种趋势,然而该架构下的数据分发面临一系列挑战。

01 多云架构下的存储挑战

在实际操作中,不少企业在各个云平台自行构建计算 Pod,来处理特定的计算任务并进行数据分发。然而,如何确保这一分发过程的持续性,并将训练结果及时归并,成为了亟待解决的难题。尤其是当数据需要跨地域传输时,性能瓶颈和数据一致性问题尤为突出。

以一个具体场景为例,图中左侧为训练集群,部署于腾讯云,而右侧则为推理集群,位于阿里云。如何将训练集群所生成的模型数据高效地分发至推理集群呢?

首要问题在于,数据的分发与异地计算难度较大,需用户自行将数据从文件系统层面拷贝至异地,并设定定时定量的策略。

其次,当数据量庞大时,若需全面同步,将耗费大量资源。而热数据往往仅占少数,企业往往难以预知哪些数据为热数据,需在读取后才能确定。因此,按需拷贝而非全面拷贝,并在异地设立本地缓存,既能提升性能,又能兼顾成本。

再者,网络带宽、出错重试等问题可能导致数据不一致。此外,云厂商通常倾向于构建封闭的生态,不愿提供跨云功能,如腾讯云便不会提供工具协助用户将数据拷贝至其他云进行分发。因此,作为云中立的第三方文件系统,我们需提供整体的解决方案,以打破单一云厂商的束缚,满足客户的跨云与多云需求。

02 JuiceFS 跨云、多云解决方案

JuiceFS 企业版是基于对象存储的分布式文件系统,相比社区版它提供了更强的元数据引擎和缓存管理能力。针对用户在多云架构中对数据访问性能的不同需求,juiceFS 提供跨区和跨地域的多种方案。

方案 1:同地域、跨云数据分发

该方案是指在同区域的不同云之间进行数据分发,常被应用于数据双活与灾备场景。通过在源区域(下图左上角)与目标区域之间建立异步数据同步关系,系统能够自动将数据从一个区域复制到另一个区域,并保证数据的一致性。

该方案采用共享元数据服务的方式,使得不同区域的客户端可以在挂载文件系统时进行就近写入,优化数据存取效率。异步复制和元数据一致性保证了在不同区域间的数据一致性和稳定性。

数据一致性方面,JuiceFS 的强一致性由元数据保证,文件有变更会在对象存储上追加新的数据块,然后元数据会指向新的数据块,所以只要元数据一致,就能确保整个文件的一致性。因此,当目标客户端访问同一元数据服务时,不存在数据不一致的情况。期间若数据已同步至目标区域存储桶,则直接从该桶读取;若尚未同步,则会回源至源存储桶读取,以确保数据的完整性和一致性。

此方案广泛适用于数据双活和灾备场景。对于数据双活应用,企业可以通过跨区数据复制在多个区域之间共享数据,实现高可用性和负载均衡。

在灾备场景中,该方案通过异步将数据备份到目标区域,避免了因源云平台出现问题(如账号封禁、访问限制等)导致的数据不可用情况。即便源区域发生故障,客户端只需挂载并切换到目标区域即可继续正常工作,数据可以无缝恢复。

方案 2:跨地域数据访问,适用于大规模 AI 训练场景

针对跨地域数据访问的性能挑战,我们提供了多种解决方案以满足不同场景下的需求。

元数据和数据同步

当两地享有共同地域的元数据服务时,数据访问通常不会受到显著延迟影响。然而,当数据需要跨国或跨大洲传输,如从新加坡或美国节点访问时,性能问题可能变得尤为突出,尤其是当涉及大量小文件时。此时,远程数据访问若未命中缓存,可能需要回源区域读取,这将严重影响性能。

为解决这一问题,我们设计了镜像文件系统功能,该功能通过同步源区域和目标区域(镜像区域)中的数据和元数据,确保两地数据一致性,从而实现跨地域数据的低延迟访问。虽然我们期望实现实时同步,但由于地域间的网络限制,实际上无法做到完全的实时性。

镜像文件系统中的操作流程如下:当源区域的客户端对源区域的存储桶发起读写操作时,会异步地将数据写入镜像区域的存储桶。当镜像区域的客户端在进行训练或推理时,系统将就近从镜像区域读取数据,以减少访问延迟从而提高性能。若数据尚未同步至镜像区域,系统将回源读取。

值得注意的是,在 JuiceFS 5.0 版本之前,镜像区域仅支持读操作;5.0 及之后版本则加入了写操作功能。在进行写操作时,系统先将数据写入镜像区域桶里,再将元数据更新到源区域的元数据服务中(注意:元数据不会直接写入镜像区域)。然后,元数据再按正常流程同步到镜像区域。

这个镜像写入流程看起来有些复杂,但为了确保在各种网络波动情况下同步不会出现错误,我们采用了单向同步的设计,虽然在写入时会承受一定的延迟,但这是为了一致性做出必要的妥协。

仅元数据同步

此外,为了应对大数据量同步时的成本和时间挑战,我们提供了按需同步的方案。用户可以选择仅同步元数据。这与上一种方式的差别就在于避免的全桶复制,虽然缺乏一定数据本地性,但如果分布式缓存有足够命中率,性能仍能得到保障。最为关键的是,这种方式省去了大量时间、复制流量及重复存储的成本。在写入数据时,系统同样将数据写回源区域的存储桶和元数据区域,并同步至镜像区域。通过这样的方式,我们实现了安全、高效的跨地域数据同步和访问。

03 某 LLM 企业腾讯云到阿里云跨云案例(仅元数据同步)

该企业在阿里云上拥有大量闲置的训练 GPU 资源,希望能够将这些资源与腾讯云的训练任务协同使用。因此,企业需要将数据从腾讯云分发到阿里云。然而,由于两者之间网络波动频繁,数据分发受阻,进而影响了训练效率,尤其是在处理大量小文件时,卡顿现象更为明显

为解决这一问题,企业选择使用 JuiceFS 来支持跨地域的数据分发场景。通过同步元数据, JuiceFS 有效降低了网络波动带来的影响。同时,为了控制成本,企业并未将所有数据同步到阿里云,而是采用分布式缓存,仅按需预热并同步需要的数据,从而在保证性能的同时优化了成本。

目前,镜像文件系统的大小约为 256TB,文件数量达到 1300 万个,平均文件大小约为18.6MB。阿里云客户端在镜像区域的数量达到 540 个,有大量的训练容器协助腾讯云进行训练。阿里云端元数据的 QPS 已达到 5.81 万次。尽管分布式缓存节点数量为 138 个,缓存容量仅为 8.8TB,但通过足够的节点数量和网卡数量,系统能够聚合出较大的带宽,缓存的最大读取吞吐量为 37GB/s,写入吞吐量为 4GB/s,能够满足该场景的性能要求

03 小结

针对用户在多云架构中对数据访问性能的不同需求,JuiceFS 从第三方云中立的角度提供完整的解决方案,不捆绑任何特定云平台。

  • 方案 1:同地域跨云数据分发
    • 适用于两地距离相对较近、数据通信稳定的场景,同时也适用于跨云桶数据灾备的解决方案。
  • 方案 2:跨地域数据访问
    • 数据与元数据均同步。此方案支持多份数据同步,尤其适用于地域相隔较远的场景。其优势在于读取性能最佳,因为元数据和数据均可从本地读取。然而,这也带来了最高的成本。
    • 仅元数据同步:兼顾成本与性能的折衷方案。元数据从本地读取,而数据则按需从缓存中读取;若缓存未命中,则回源读取。然而,其写入性能相对一般,因为无论是数据还是元数据,均需回源写入。此方案尤其适用于对成本敏感且镜像区域大量数据为只读的场景。

标签:分发,同步,缓存,区域,镜像,JuiceFS,数据,多云
From: https://www.cnblogs.com/JuiceData/p/18664024

相关文章

  • 【05】2025年1月首发完整版-篇幅较长-苹果app如何上架到app store完整流程·不借助第
    【05】2025年1月首发完整版-篇幅较长-苹果app如何上架到appstore完整流程·不借助第三方上架工具的情况下无需花钱但需仔细学习-优雅草央千澈详解关于APP签名以及分发-们最关心的一篇来了-IOS上架app背景介绍接第四篇提交了安卓商店后,需要等待审核结果,但是目前苹果上架我们......
  • JuiceFS 详解:一款为云原生设计的高性能分布式文件系统
    JuiceFS详解:一款为云原生设计的高性能分布式文件系统1.什么是JuiceFS?JuiceFS(JuicedFileSystem)是一款高性能、POSIX兼容的云原生分布式文件系统。它采用对象存储作为底层存储,支持多种元数据引擎,如Redis、MySQL、PostgreSQL等,通过强大的缓存机制提供快速的数据访问,具有......
  • JuiceFS 2024:开源与商业并进,迈向 AI 原生时代
    即将过去的2024年,是JuiceFS开源版本推出的第4年,企业版的第8个年头。回顾过去这一年,JuiceFS社区版依旧保持着快速成长的势头,GitHub星标突破11.1K,各项使用指标增长均超过100%,其中文件系统总数量较前一年更是增长了8.5倍;企业版同样持续保持高速增长,继去年实现盈亏平衡......
  • 贪心算法之分发糖果--附java完整代码
    leetcode135.分发糖果classSolution{/**分两个阶段1、起点下标1从左往右,只要右边比左边大,右边的糖果=左边+12、起点下标ratings.length-2从右往左,只要左边比右边大,此时左边的糖果应该取本身的糖果数(符合比它......
  • 代码随想录算法训练营第二十九天|134加油站、135分发糖果、860柠檬水找零、406根据身
    day29贪心算法part031.134加油站解题思路:(1)总体条件判断:如果gas数组的总和小于cost数组的总和,则无论从哪个加油站出发,汽油都不足以完成一圈,返回-1。(2)寻找起点:设定两个变量:total_tank:总剩余汽油量,表示从头到尾累计整个数组的油量差,目的是判断总的油量......
  • SQL进阶技巧:如何计算算法题分发糖果问题?
    目录0问题描述1数据准备2问题分析3小结专栏优势:(1)一次收费持续更新。0问题描述有 n 个孩子站成一排,每个孩子都有一个评分值(整数),你需要按照以下要求给这些孩子分发糖果:每个孩子至少分配到1颗糖果。评分更高的孩子必须比他左右两边评分低的孩子获得更多的糖果......
  • 短剧业务产业链涉及的技术系统-云计算与存储-视频存储与分发:使用云平台(如AWS、阿里云
    短剧业务产业链涉及的技术系统中,云计算与存储在视频存储与分发方面具有重要作用。使用云平台(如AWS、阿里云、腾讯云)存储和处理大规模视频内容已经成为行业标准。阿里云、腾讯云和AWS等云服务提供商提供了从视频上传、转码、存储到分发等一系列完整的解决方案,这些方案能够支持......
  • 代码随想录算法训练营第二十七天|455分发饼干、376摆动序列、53最大子序和
    day27贪心算法part01贪心算法没有什么规律可言,没有思路就立刻看题解。1.455分发饼干为了满足更多的小孩,就不要造成饼干尺寸的浪费。大尺寸的饼干既可以满足胃口大的孩子也可以满足胃口小的孩子,那么就应该优先满足胃口大的。先将饼干数组和小孩数组排序,然后从后向......
  • 【01】优雅草央千澈详解关于APP签名以及分发-上架完整流程-如何将安卓APP-apk包和IOS
    【01】优雅草央千澈详解关于APP签名以及分发-上架完整流程-如何将安卓APP-apk包和IOS苹果app-ipa包上架至应用商店-安卓以华为|小米|vivo|oppo|应用宝为例-苹果上架以appstore为例合计三篇背景介绍2024年12月13日优雅草APP分发平台youyacao.cn建立,提供服务(优雅草2019年就曾建......
  • 【Python应用】Jep:将Python无缝嵌入到Java应用程序中,充分发挥两种语言的潜力
    Python以其简洁的语法和丰富的库而闻名,而Java则以其性能和稳定性著称。如果能将两者的优势结合起来,将会产生巨大的开发效率提升。Jep(JavaEmbeddedPython)正是这样一个桥梁,它允许你将CPython无缝嵌入到Java应用程序中,从而充分发挥两种语言的潜力。Jep的核心功能:无缝衔接Java......