首页 > 其他分享 >转载:【AI系统】死代码消除

转载:【AI系统】死代码消除

时间:2024-12-11 21:43:22浏览次数:4  
标签:删除 AI 代码 编译器 基本块 test 操作 转载 节点

死代码消除(Dead Code Elimination)是一种编译器优化技术,旨在删除程序中不会被执行的代码,从而提高程序的执行效率和资源利用率。死代码是指在程序的当前执行路径下不会被访问或执行的代码片段。

传统编译器的死代码消除

死代码消除的目的是删除程序中无用和不可达操作对应的代码。在传统编译器中,死代码消除通常是通过分析控制流图(CFG),从而找到并删除无用和不可达操作对应的代码。

不可达操作

不可达操作通常有两类:

第一种是不可达基本块中的操作。在控制流图中,对于某个基本块 $b_i$ ,如果从入口基本块 $b_0$ 存在一条路径能够到达 基本块 $b_i$ ,则 $b_i$ 是可达基本块,反之则为不可达基本块。当一个操作位于不可达基本块块中,根据不可达基本块的定义,该操作将不可能被执行到,所以该操作为不可达操作。

第二种是由条件分支优化导致的舍弃基本块中的操作。在控制流图中,当某个基本块 $b_i$ 进行条件转移时,如果其条件在编译阶段是可以直接被计算出来的话,那么编译器在编译阶段就可以很清楚条件转移将会前往那个分支。相比于执行的分支,另一个分支将不会被编译器所执行,这个分支所对应的所有操作都是不可达操作。

image

如上面的控制流图所示,其中 $b_9$ 是一个不可达的基本块,因为不存在一条路径从 $b_0$ 到达 $b_9$ ,所以 $b_9$ 中的所有操作都是不可达操作。对于基本块 $b_3$ 以及其两个条件转移目的基本块 $b_4$ 和 $b_5$,假设 $b_3$ 的条件转移条件始终为 true 且 $b_4$ 为 true 所对应的条件转移目的基本块,在这种情况下,$b_5$ 将不会被执行到,$b_5$ 中所对应的操作为不可达操作。

以下是一个简单的不可达操作删除的例子:

def test(flag):
    if(flag):
        print("Flag is True")
    else:
        print("Flag is False.")
    return
    print("This code is unreachable.")

test(False)

上面是用 python 实现的一段代码。在该程序中,test 函数的输入始终为 False,所以在 test 函数内部,print("Flag is True") 这条语句将永远不会被执行到,所以这条语句为不可达操作。编译会将上述代码优化为:

def test(flag):
    print("Flag is False.")
    return
    print("This code is unreachable.")

test(False)

在 test 函数中,当 test 进行 return 后任有一个打印操作 print("This code is unreachable.") ,由于该操作位于 return 后,永远不会被执行到,编译器会将上述代码进一步优化成:

def test(flag):
    print("Flag is False.")
    return

test(False)

在传统编译器中,第一种不可达操作的删除通常是通过深度优先搜索遍历基本块集合。从入口基本块 $b_0$ 开始,遍历基本块集合,找到所有的可达基本块并打上标记,之后再遍历一次基本块集合,找到所有的不可达基本块,然后删除不可达基本块到可达基本块的边。第二种不可达操作的删除,通常在编译阶段,对于已确定条件的条件转移,编译器会进行特殊标记,在死代码消除阶段,编译器根据标记删除掉不流动的那条边,这样该分支对应的基本块就从可达基本块变成不可达基本块,之后通过不可达基本块的删除即可。

无用操作

无用操作是指其结果没有外部可见效应,比如冗余的变量赋值操作,该变量在定义后没有在后续的操作中使用到,不会对后续操作产生任何影响,所以可以直接删除该变量赋值操作。在传统编译器中,编译器如何判断一个操作是否是无用操作呢?

在传统编译器中,有一些操作可以被认为是一定有用的,一些书中将这种操作称为关键操作。而参与关键操作计算的或者控制流程图流向关键操作所在基本块的条件转移或跳转操作也可以认为是有用的,编译器可以通过。

以下是一个简单的删除无用操作的例子:

def test(a,b,c):
    x = a + b
    y = x + c
    return y

test(1,2,3)

上面是用 python 实现的一段代码。在 test 函数中,因为最后的结果需要返回变量 y,此时变量 y 对于 test 函数来说是有用的,而 y 又需要通过 x 计算得到,所以变量 x 对于 test 函数来说也是有用的。简单修改一下代码:

def test(a,b,c):
    x = a + b
    y = x + c
    return a+b+c

test(1,2,3)

上面是用 python 实现的一段代码。在 test 函数中,返回值从变量 y 变成了 a+b+c,此时变量 y 和 x 并不会影响到 test 函数的功能,所以变量 y 和 x 都是无用的代码。

从上面可以看出,函数的 return 操作是关键操作中的一种。关键操作的特点是它们的执行结果或副作用会直接或间接地影响程序的状态、数据流或与外部环境的交互。下面给出几种的关键操作:

  • 操作与过程的返回结果有关:这包括对引用调用参数进行修改、对全局变量进行赋值、通过具有歧义的指针进行赋值、作为返回值通过 return 语句返回等。这些操作的结果可能会影响到调用该过程的代码或其他代码对应的内存值。

  • 输入输出语句:输入输出语句是指与程序的输入和输出相关的操作,例如读取用户输入、打印输出到控制台或文件等。这些操作可以影响程序的交互性和与外部环境的通信。

  • 可以影响当前过程外可访问的内存值:这包括对共享内存区域进行读写、对全局变量进行修改等操作。这些操作可能会影响到其他代码对应的内存值,从而引起并发问题或数据不一致性。

在确定关键操作后,编译器就可以通过关键操作找到所有的有用操作,这里的有用操作分为两类:

  • 第一类是关键操作操作数所对应的操作,这类操作的结果通常是参与了关键操作的计算,所以这类操作是有用的。

  • 第二类是引导控制流流向关键操作所在基本块所对应的条件转移操作。

在了解传统编译器中通常是如何进行无用代码消除之前,首先需要了解后支配性和控制依赖性。

后支配性:在控制流图中,对于基本块 $b_i$ 和 $b_j$,如果所有非空路径从 $b_i$ 到出口基本块都经过 $b_j$,则称 $b_j$ 后支配 $b_i$。其计算公式为

$$
RDOM(n) = {n} \cup (\bigcap_{m\in{succ(n)}}RDOM(m))
$$

其中 RDOM(n) 表示 基本块 $b_n$ 所对应的后支配节点,succ(n)表示 基本块 $b_n$ 的所有后继节点。在此处并不考虑支配性的严格性,所以 RDOM(n) 中包含自身。而对于后继节点的后支配节点,由后支配性的定义,需要所有路径同时经过的基本块,所以这里取所有后继节点的后支配节点的交集。

image

如上图,其中 $b_3$ 的后支配节点为 {$b_3$,$b_6$,$b_7$,$b_8$},$b_4$ 的后支配节点为 {$b_4$,$b_6$,$b_7$,$b_8$},其余节点的后支配节点读者可以自行探索。

控制依赖性:在控制流图中,对于基本块 $b_i$ 和 $b_j$,如果存在一条或多条非空路径从 $b_i$ 到 出口基本块,且路径经过 $b_j$ 。同时也存在一条或多条非空路径从 $b_i$ 到 出口基本块,且路径不经过 $b_j$,直观上看,$b_j$ 能否执行取决于 $b_i$ 的条件转移,$b_j$ 在控制上依赖 $b_i$,称 $b_i$ 是 $b_j$ 的控制依赖点。

image

如上图,$B_4$ 和 $B_5$ 的控制依赖点为 $B_3$ ,以 $B_4$ 为例,从 $B_3$ 到出口节点 $B_8$,存在非空路径${B_3\rightarrow B_4\rightarrow B_6\rightarrow B_8}$经过 $B_4$,又存在非空路径${B_3\rightarrow B_5\rightarrow B_6\rightarrow B_8}$不经过 $B_4$,所以 $B_4$ 的控制依赖点为 $B_3$ , $B_5$ 同理。

在传统编译器中,对于某个关键操作 i ,假设 i:v = x op y,如果操作 x 和 y 的定义没有被标记上有用,则将其标记为有用操作。然后遍历关机操作 d 所在块的控制依赖块,将控制依赖块的条件转移操作标记为有用。在标记操作完成后,需要将无用的条件转移操作转化为跳转操作,跳转到该基本块的第一个含有用操作的后支配节点。因为当一个基本块的条件转移操作没有被标记为有用,那么从其后继结点一直到其直接的后向支配者结点,都不包含有用操作。如果其直接后继节点不包含有用的操作,也是同样。由于出口节点是一定含有有用操作,所以上述操作在向后查找的过程中,一定会停止。

AI 编译器中的死代码消除

AI 编译器通常是通过分析计算图,找到无用的计算节点或不可达的计算节点,然后消除这些节点。

在计算图中,不可达节点是指从输入节点通过图中的有向边无法到达的节点。如下图,计算图中有 A,B,C 三个算子,假设三个算子都不是输入节点。不存在一条路径从输入节点到 B 节点,所以 B 节点是不可达节点,AI 编译器会删除该节点,并删除其到可达节点的边,即边 $B \rightarrow C$。

image

在计算图中,无用节点是指某个计算节点的结果或副作用不会对输出节点产生影响。如下图,计算图中有 A,B,C 三个算子,B 节点输出没有后继节点,不会对后续的计算图流程产生影响,所以 B 节点是无用节点,AI 编译器会将该节点删除。

image

除此之外,训练的时候会产生大量的子图,而这些子图通常对于推理来说是无用的,所以在推理的时候可以删除这些无用的子图。

死代码消除案例

以 Golang 为例,简单了解一下AI编译器是死代码消除的一种实现。

  1. 通过控制流分析,找到可达的基本块(ReachableBlocks 函数)。编译器通过深度优先搜索,从入口基本块开始遍历控制流图。将遍历到的所有基本块都标记为可达。
  2. 从不可达的基本块中删除出边。遍历控制流图中的所有基本块,如果某个基本块 $b_n$ 未被标记为可达,则遍历 $b_n$ 的所有后继节点,如果后继节点是可达的,则删除 $b_n$ 到该节点的边。
  3. 从可达的基本块中删除无效的出边。如果某个基本块 $b_n$ 的条件转移操作的条件已经确定,Golang 在 lower pass 优化阶段会将此条件操作进行标记,并确定需要前往的后继节点,而其他后继节点将不会被执行到,所以需要删除 $b_n$ 到这些节点的边。
  4. 找到有用操作,并删除无用操作。根据关键操作找到所有有用的操作,然后将无用的操作删除。在 Golang 中,每一步操作都会用一个 Value 对象来表示操作得到的结果。所以 Value 对象可以代表一个操作,将无用的操作所对应的 Value 对象值设置为空值,然后遍历所有基本块,将基本块中值为空的所有 Value 对象删除,从而达到删除无用操作的目的。
  5. 删除不可达操作。不可达操作对应的基本块是第二步和第三步产生的,在经历过第四步之后,这些基本块一个 Value 对象都没有,即空块。编译器通过遍历所有的基本块,找到空块并删除,从而达到删除不可达操作的目的。

如果您想了解更多AI知识,与AI专业人士交流,请立即访问昇腾社区官方网站https://www.hiascend.com/或者深入研读《AI系统:原理与架构》一书,这里汇聚了海量的AI学习资源和实践课程,为您的AI技术成长提供强劲动力。不仅如此,您还有机会投身于全国昇腾AI创新大赛和昇腾AI开发者创享日等盛事,发现AI世界的无限奥秘~
转载自:| https://www.cnblogs.com/ZOMI/articles/18560280 | header |
| ---------------------------------------------- | ------ |
| | |

标签:删除,AI,代码,编译器,基本块,test,操作,转载,节点
From: https://www.cnblogs.com/xueaigc/p/18600802

相关文章

  • 转载:【AI系统】计算与调度
    上一篇我们了解了什么是算子,神经网络模型中由大量的算子来组成,但是算子之间是如何执行的?组成算子的算法逻辑跟具体的硬件指令代码之间的调度是如何配合?计算与调度计算与调度的来源图像处理在当今物理世界中是十分基础且开销巨大的计算应用。图像处理算法在实践中需要高效的实现......
  • 转载:【AI系统】AI 编译器后端优化
    AI编译器分为多层架构,最顶层由各种AI训练框架编写的神经网络模型架构,一般由Python编写,常见的AI训练框架有PyTorch、MindSpore、PaddlePaddle等。在导入AI编译器时需要用对应框架的converter功能转换为AI编译器统一的GraphIR,并在计算图级别由GraphOptimizer进......
  • 转载:【AI系统】分布式通信与 NVLink
    在进入大模型时代后,大模型的发展已成为AI的核心,但训练大模型实际上是一项比较复杂的工作,因为它需要大量的GPU资源和较长的训练时间。此外,由于单个GPU工作线程的内存有限,并且许多大模型的大小已经超出了单个GPU的范围。所以就需要实现跨多个GPU的模型训练,这种训练方式就......
  • 转载:【AI系统】编译器基础介绍
    随着深度学习的不断发展,AI模型结构在快速演化,底层计算硬件技术更是层出不穷,对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将算力发挥出来,还要应对AI框架的持续迭代。AI编译器就成了应对以上问题广受关注的技术方向,让用户仅需专注于上层模型开发,降低手工优化性能......
  • 转载:【AI系统】GCC 主要特征
    GCC(GNUCompilerCollection,GNU编译器集合)最初是作为GNU操作系统的编译器编写的,旨在为GNU/Linux系统开发一个高效的C编译器。其历史可以追溯到1987年,当时由理查德·斯托曼(RichardStallman)创建,作为GNU课程的一部分。最初,GCC仅是一个用于编译C语言的编译器,但很快扩......
  • 转载:【AI系统】LLVM IR 基本概念
    在上一篇文章中,我们已经简要介绍了LLVM的基本概念和架构,我们现在将更深入地研究LLVM的IR(中间表示)的概念。了解LLVMIR的重要性是为了能够更好地理解编译器的运作原理,以及在编译过程中IR是如何被使用的。LLVMIR提供了一种抽象程度适中的表示形式,同时能够涵盖绝大多数源......
  • 转载:【AI系统】LLVM 架构设计和原理
    在上一篇文章中,我们详细探讨了GCC的编译过程和原理。然而,由于GCC存在代码耦合度高、难以进行独立操作以及庞大的代码量等缺点。正是由于对这些问题的意识,人们开始期待新一代编译器的出现。在本文,我们将深入研究LLVM的架构设计和原理,以探索其与GCC不同之处。LLVM发展历程......
  • 转载:【AI系统】LLVM 前端和优化层
    在上一篇文章讲到了LLVM的IR贯穿了LLVM编译器的全生命周期,里面的每一个箭头都是一个IR的过程,这个就是整体LLVM最重要的核心概念。有了LVMIR之后这并不意味着LLVM或者编译器的整个Pipeline都是使用一个单一的IR,而是在编译的不同阶段会采用不同的数据结构,但总体......
  • Python单元测试:构建稳健代码的关键
    引言在软件开发中,测试是确保代码质量和可靠性的必要环节。单元测试是验证单个组件或模块是否按预期工作的测试方法。它通过自动化测试来检验每个功能模块的正确性,帮助团队及早发现和修复潜在的问题。本文将深入探讨Python中的单元测试,包括如何编写和运行测试、常用的测试框架......
  • AI产品落地的多角度探索与实践
    AI产品落地的多角度探索与实践是一个复杂而多维的过程,它涉及技术创新、行业应用、人机协作等多个方面。在构建多智能体平台AgentFoundry的基础上,我们可以将其应用于制造业、教育、政府、跨境电商等行业,并从中抽象出三种核心范式:AI+人协作、信息中枢和数字员工。以下是对这三种范......