https://www.bilibili.com/video/BV17b4y1W7rk/?spm_id_from=autoNext&vd_source=3ad05e655a5ea14063a9fd1c0dcdee3e
后门准则需要先理解后门路径,后门路径就是在x和y之间有一个指向x的路径,就是有一个指向x的箭头的路径,注意除了指向x的那一小块路径之外,其他箭头的方向是无所谓的。如果所有这些可能的后门路径,都可以用控制变量的方法进行阻断的话,那么这基于do(x)的条件概率就可以使用整张的第一层观测数据进行计算。
比如上述的因果图,Z对X和Y都有作用。这是一个经典的分叉结构;不过同时X对Y也会产生影响,根据对backdoor的定义,那xzy这条路线就是一个后门路径。也是唯一的一个后门路径。
如果想要阻断这个路径,就要把z控制住,这里的z就是刚才提到的一个confounder干扰因子。
backdoor path/后门路径
如果一条无向连接X和Y的路径中,有指向X的箭头,则这条路径被称为从X到Y的后门路径。其实就是在这条路中,存在confounder同时影响treatment和outcome
1.后门准则
定义:给定有向无环图(DAG)中一对有序变量(X,Y),如果变量集合Z(可以为空)满足:
Z中没有X的后代节点。
Z阻断了X与Y之间的每条含有指向X的路径。
满足以上两点的Z,就称Z满足关于(X,Y)的后门准则。
如果变量集合Z满足(X,Y)的后门准则,那么X对Y的因果效应可以由下面的公式计算。
证明如下:
一般而言,我们希望节点Z最好可以满足下面这些条件:
阻断X和Y之间的所有伪路径(即所有指向X的路径)。
保持所有X到Y的有向路径不变。
不会产生新的伪路径。(例如condition在collider或者其后代上,可能就会产生一条新的伪路径)。
下面展示一个简单的例子:
根据上述因果图,估计X对Y的因果效应。从图中可以看出,从X到Y有两条路径,第一条是X-M-Y,第二条是X-W-Y。我们想要估计X对Y的因果效应,就应该要阻断第二条路径。根据上面的后门准则,我们可以发现W满足后门准则,所以我们校正W(或者说Condition在W上),就可以得到X对Y的因果效应。前提是W必须是可观测的!
如果W是不可观测的,那么对于W还可以使用后门准则吗?答案是否定的,因为我们无法观测到W,所以无法阻断X-W-Y这条路径,也就无法消除Confounding association,此时association就不是causation.
2.前门准则
定义:如果一个变量集合Z满足以下条件:
Z切断了所有X到Y的有向路径。
X到Z没有后门路径。
所有Z到Y的后门路径都被X阻断。
则称变量集合Z满足有序变量(X,Y)的前门准则。
如果Z满足变量对(X,Y)的前门准则和Positivity(即),那么X对Y的因果效应是可识别的,且由下式计算:
假设我们有一个这样的因果图:
证明如下:
对于上面的图,即使W是不可观测的,那么我们依然可以使用前门准则,估计X对于Y的因果效应。
但是有些情况,前后门准则都可能无法使用,例如下面这种情况。
因为W1和W2都是无法观测的,无论你使用前门准则还是后门准则,其T对于Y的因果效应总是无法正确估计的。对于这种情况,我们可以使用unconfounded children criterion或者do-calculus来正确估计。这两种方法就不再这里说了,感兴趣的可以自己去看看。
地址为:https://www.bradyneal.com/Introduction_to_Causal_Inference-Dec17_2020-Neal.pdf,在第六章可以看到。
原文链接:https://blog.csdn.net/qq_31063727/article/details/118672598