Ray 源码分析系列(15)—Ray Dag

时间：2025-01-10 17:31:46浏览次数：3

标签：Dag remote Graph dag Compiled Ray 源码 ray

前言

官方文档关于dag几乎没有多少资料，只有使用示例。另外，官博上提到了 dag.experimental_compile 能够提升20%训练吞吐，并且以更低的开发成本实现不同并行策略，所以好奇地分析一下dag和compiled graph有什么可以学习的地方吧。

在这里插入图片描述

Dag关键特性

Lazy Computation Graphs：懒计算模式，即可以等所有task/actor定义完之后再执行，方便做图优化
Custom Input Node: 支持数据变但计算图不变，避免重复建图
Multiple Output Node: 计算图不变，但支持多输出(不清楚内部是并行执行两个graph还是batch 模式)
Reuse Ray Actors in DAGs：通过调用.remote() ，避免actor在graph执行完成后被销毁

Dag使用示例

import ray
from ray.dag.input_node import InputNode
from ray.dag.output_node import MultiOutputNode

@ray.remote
class Worker:
    def __init__(self):
        self.forwarded = 0

    def forward(self, input_data: int):
        self.forwarded += 1
        return input_data + 1

    def num_forwarded(self):
        return self.forwarded

# Create an actor via ``remote`` API not ``bind`` API to avoid
# killing actors when a DAG is finished.
worker = Worker.remote()

with InputNode() as input_data:
    dag = MultiOutputNode([worker.forward.bind(input_data)])

# Actors are reused. The DAG definition doesn't include
# actor creation.
assert ray.get(dag.execute(1)) == [2]
assert ray.get(dag.execute(2)) == [3]
assert ray.get(dag.execute(3)) == [4]

# You can still use other actor methods via `remote` API.
assert ray.get(worker.num_forwarded.remote()) == 3

Ray Compiled Graph

Ray Compiled Graph is currently at a developer preview stage. The APIs are subject to change and expected to evolve. The API is available from Ray 2.32.

Why Compiled Graph

REP中也有提到，设计目标是：

task overhead（来自rpc的损耗和dynamic memory allocation）下降到数十微秒级别，当前是1ms左右
支持gpu 通信原语，当前只支持cpu（很难利用上rdma和nccl的技术）

而compile graph 真正的key idea在于，缩短control plane 的overhead。而要实现这一点，就需要知道某个DAG pattern会被重复的使用。当我们知道这些pattern以后，在local node上的通信就可以通过shared-memory来执行了。

在这里插入图片描述

Compiled Graph 示例

在这里插入图片描述

关键特性

Ray Compiled Graph 的静态执行模型及其相比经典 Ray APIs 的有一定优势，基于静态特性实现的一系列优化。

执行模型差异
- Ray Compiled Graph：采用静态执行模型，意味着在执行前，整个计算图的结构和执行计划是确定的。这种模型下，计算图在编译阶段就可以进行各种分析和优化，从而为后续执行做好充分准备。
- 经典 Ray APIs：是 eager 模式，即任务会立即被调度执行，每次调用 .remote() 方法就会立即启动任务。这种模式简单直接，但在资源管理和优化方面相对缺乏灵活性。
基于静态特性的优化
1. 预分配资源：通过预分配资源，Ray Compiled Graph 可以提前规划和准备所需的计算资源，如 CP

标签：Dag,remote,Graph,dag,Compiled,Ray,源码,ray
From： https://blog.csdn.net/weixin_43956669/article/details/144976730

毕业设计-可白嫖源码-基于python的零食小铺管理系统（案例分析）
摘要从上世纪末到目前，计算机科学技术已经被尝试应用在各个职业各个领域，在商业贸易上，使用比重较高。计算机科学技术包括软件技术、网络技术、硬件技术等，越来越多的商家使用计算机来进行营业，出售、收购、宣传各类商品，各类商业系统、软件解放了商家的双手，使商家把利益最......
毕业设计-可白嫖源码-SSM 电影评论数据分析与推荐系统（案例分析）
摘要信息化社会内需要与之针对性的信息获取途径，但是途径的扩展基本上为人们所努力的方向，由于站在的角度存在偏差，人们经常能够获得不同类型信息，这也是技术最为难以攻克的课题。针对电影评论数据分析与推荐等问题，对电影评论数据分析与推荐进行研究分析，然后开发设计出电影评论......
java基于大数据的身体健康管理平台论文+源码 2025毕设
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容一、研究背景在当今社会，随着科技的飞速发展，大数据技术已经渗透到各个领域。在健康管理方面，人们产生的健康数据呈海量增长趋势，如医疗记录、健康监测设备数据等......
java基于JSP学生信息管理系统论文+源码 2025毕设
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容一、研究背景在当今的教育环境中，随着学校规模的不断扩大和教育管理事务的日益繁杂，传统的人工管理方式已难以满足高效、准确管理学生信息的需求。学校需要处理......
springboot软件工程课程辅助学习网站源码毕设+论文
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着信息技术的飞速发展和互联网的广泛普及，教育领域正经历着深刻的变革。软件工程作为计算机科学与技术的重要分支，其课程内容复杂且实践性强，对学生的......
SpringBoot少数民族饰品销售系统nu08t（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表用户,饰品信息,饰品入库,饰品订单,饰品退货开题报告内容一、项目背景与意义在全球化和文化多样性日益受到重视的背景下，少数民族文化作为中华文化宝库中的重要组......
SpringBoot少儿编程管理系统m9593（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表家长,学生,课程分类,课程信息,课程购买开题报告内容一、研究背景随着社会经济的发展和人们对教育培训需求的增加，少儿编程教育逐渐成为了家长和学生选择的重要教......
基于SpringBoot+Vue+uniapp的民宿在线预定平台毕业设计的详细设计和实现(源码+lw+部署
前言......
计算机毕业设计—96682 Springboot 社区助老志愿服务系统（源码免费领）
摘要大数据时代下，数据呈爆炸式地增长。为了迎合信息化时代的潮流和信息化安全的要求，利用互联网服务于其他行业，促进生产，已经是成为一种势不可挡的趋势。在图书馆管理的要求下，开发一款整体式结构的社区助老志愿服务系统，将复杂的系统进行拆分，能够实现对需求的变化快速响应、系......
计算机毕业设计—57430 Springboot校园广播系统的开发（源码免费领）
摘要高校校园中的广播系统存在的差距较大，主要为传统的有线定压广播、调频发射广播、网络模式广播等。有线定压广播布线施工复杂，维修因难。调频广播频率少，易受外界环境干扰。而随着网络媒体技术的发展，校园广播系统也出现了新的形式，基于互联网的智能化广播改善了使用和修护中......

Ray 源码分析系列(15)—Ray Dag

前言

Dag关键特性

Dag使用示例

Ray Compiled Graph

Why Compiled Graph

Compiled Graph 示例

关键特性

相关文章

赞助商

阅读排行