首页 > 其他分享 >从学习到的因果网络中估计因果效应

从学习到的因果网络中估计因果效应

时间:2024-09-10 19:22:42浏览次数:12  
标签:SCM 变量 模型 网络 效应 查询 学习 因果

本文介绍了一种新的因果效应推断方法,它不同于传统的先构建概率表达式再用观测数据评估的方法。该研究提出了一种替代方案,即直接从观测数据中学习因果贝叶斯网络(CBN)及其潜在变量,然后利用学习到的模型来回答因果效应查询。这种方法特别适用于离散的可观测变量。通过实验评估表明,这种基于模型完成的学习方法在大型模型中尤其有效,能够克服传统方法在计算上遇到的挑战。论文还对比分析了不同算法和技术的应用,包括期望最大化(EM)算法的不同实现、概率推理算法以及用于学习和推断的软件包等。

从学习到的因果网络中估计因果效应_概率分布

1 结构因果模型

结构因果模型(SCM)是一个四元组M = ⟨U, V, F, P(U)⟩:

  • U:一组外生的潜在变量,它们的值受模型之外的因素影响。
  • V:一组内生的可观测变量,它们的值由模型中的其他变量决定。
  • F:一组函数fi,每个fi确定变量Vi的值vi,该值依赖于Vi的因果父节点PAi。
  • P(U):潜在变量U的概率分布,假设这些变量相互独立。

(1)因果图

  • 诱导因果图:SCM诱导了一个有向图G = ⟨V ∪ U, E⟩,其中每个节点对应SCM中的一个变量,且存在一条从节点X到Vi的边当且仅当X是Vi的父节点。
  • Markovian SCM:如果每个潜在变量最多连接到一个可观测变量,则称之为Markovian。
  • Semi-Markovian SCM:如果每个潜在变量最多连接到两个可观测变量,则称之为Semi-Markovian。所有SCM都可以转换为等价的Semi-Markovian形式,且保持因果查询的答案不变。
  • Acyclic Directed Mixed Graph (ADMG):在Semi-Markovian情况下,简化因果图的一种形式,省略只有一个孩子的潜在变量,并用双向虚线弧替换有两个孩子的潜在变量。

(2)因果贝叶斯网络 (CBN):

  • CBN由SCM的因果图G = ⟨V ∪ U, E⟩和相关的条件概率分布P组成。
  • 概率分布:P(V, U)根据因果图分解为各个条件概率的乘积。
  • 观测分布:P(V)通过对所有潜在变量的边际化得到。

(3)因果效应与干预:

  • 干预操作:外部干预通过强制变量X取特定值x来模拟,用do(X = x)表示。
  • 干预后分布:干预后SCM的分布由截断公式给出,即去除被干预变量对应的因子并设置其值。
  • 因果效应:P(Y|do(X))定义为在干预后分布中对除Y以外的所有变量进行边际化。

(4)因果查询的可识别性:

  • 可识别性:给定一个因果图G,如果任何两个与G一致的SCM都具有相同的观测分布P(V),并且也具有相同的P(Y|do(X)),则称P(Y|do(X))是可识别的。

2 基于学习的因果推断

基于学习的因果推断是一种通过直接从观测数据中学习因果贝叶斯网络及其潜在变量,进而利用该模型来高效回答因果效应查询的方法。

  • 学习过程是使用期望最大化 (EM) 算法学习模型和潜在变量的分布。利用学习到的 CBN 通过概率推理来回答因果效应查询。
  • 随后,通过一系列实验评估所提方法的有效性,包括对合成网络和真实世界网络的评估。结果显示,对于多个查询,学习时间可以被分摊,从而提高了每查询的时间效率。
  • 与传统插值方法相比,插值方法需要针对每个新查询重新估计表达式,即使是在同一模型上。相比之下,基于学习的方法只需学习一次模型即可用于多个查询,这使得它在处理多个查询时更加高效。

3 结语

文章提出了一种新的因果推断方法,该方法通过直接从观测数据中学习包含潜在变量的因果贝叶斯网络,并利用该模型来高效地回答因果效应查询,相较于传统的基于表达式的估计方法更具优势,尤其是在处理较大规模模型时。

论文题目: Estimating Causal Effects from Learned Causal Networks

论文链接: https://arxiv.org/abs/2408.14101


PS: 欢迎大家扫码关注公众号_,我们一起在AI的世界中探索前行,期待共同进步!

从学习到的因果网络中估计因果效应_概率分布_02

精彩回顾

1. 基于大语言模型智能体的自主机器学习

2. 基于人机偏好的协作

3. 具身人工智能的最新进展--综述

标签:SCM,变量,模型,网络,效应,查询,学习,因果
From: https://blog.51cto.com/u_16811054/11972513

相关文章

  • 计算机网络:概述 - 计算机网络概述
    目录一.  互联网概述1.1  网络1.2  互联网1.3  因特网 二.  互联网发展的三个阶段三.  互联网的标准化工作四.  互联网的组成五.  计算机网络的类别5.1  计算机网络的定义5.2  计算机网络的不同类别一.  互联网概述起源于美国......
  • Day5网络编程:epoll+服务器模型+ftp
    1.io多路复用:epollepoll的提出--》它所支持的文件描述符上限是系统可以最大打开的文件的数目;eg:1GB机器上,这个上限10万个左右。每个fd上面有callback(回调函数)函数,只有产生事件的fd才有主动调用callback,不需要轮询。注意:Epoll处理高并发,百万级1.红黑树:是特殊的二叉......
  • 关于神经网络过拟合的问题,我来解答一下!
    我们可以逐一进行分析:一.为什么模型很快就过拟合了,也就是验证集的损失在几十次迭代后就开始上升了?模型很快出现过拟合的原因可能有几个:模型复杂度过高:如果模型(如神经网络)的容量(即参数数量、层数等)相对于数据集的规模来说过大,那么模型很容易学习到训练数据中的噪声和细节,导......
  • *Python*机器学习算法——神经网络和深度学习
            神经网络和深度学习是现代机器学习的重要组成部分,它们在图像识别、语音识别、自然语言处理等多个领域取得了显著的成功。本文将详细介绍神经网络和深度学习的基本函数概念,并通过一个简单的例子来展示如何使用Python和Keras库构建一个神经网络模型。1、前置库......
  • 超轻量级、支持插件的 .NET 网络通信框架
    ##超轻量级、支持插件的.NET网络通信框架在当今高度互联的世界中,高效、可靠的网络通信是构建各种应用程序的关键。无论是开发Web服务、实时通信应用,还是物联网设备,都需要一个强大且灵活的网络通信框架来支撑。然而,传统的网络通信框架往往过于臃肿,难以满足现代应用程序对性能和......
  • 【入门网安】想入门网络安全却不知道怎么入手,这篇文给你规划的明明白白的
    ......
  • IT技术人员想转行网络安全?来看看这篇
    ......
  • 卷积神经网络(李沐老师课程)
    卷积神经网络(李沐老师课程)回顾MLP单层(上述列子需要14GBGPU)找寻图片上的人在哪里找寻图片上的人的两个基本原则从全连接层出发到卷积卷积层二维交叉相关二维卷积层案列交叉相关和卷积代码的实现importtorchfromtorchimportnnfromd2limportt......
  • Java学习 - 网络编程
    1.网络编程入门1.1网络编程概述计算机网络是指将地理位置不同的具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统,网络管理软件及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统网络编程在网络通信协议下,不同计算机上运行的程序......
  • 网络安全(黑客技术)—2024自学手册
    ......