潜在结果:
存在可观测结果与不可观测结果。
Yi=DiY1i+(1-Di)Y0i
因果推断的核心:想办法估计未出现观测到的反事实结果。
方法:利用同一物理个体不同时间的信息或同一时间不同物理个体的信息
稳定性假设:
一、不同个体潜在结果之间不会有交互影响
二、干预水平对所有个体都相同
事实中两个假设都不太可能满足,尽可能的满足第一条假设
分配机制:
识别未知的分配机制,从而估计因果效应。
因果图:
共同原因成为混杂因素,消除混杂因素需要添加混杂因素控制变量X以消除混杂偏差。
共同结果,产生共同结果,造成样本选择偏差。
混杂偏差与样本选择偏差统称为选择偏差。
阻断相关性方法:1、加入控制变量分组回归,剔除相关性。2、不以共同结果为条件,扩充样本选择多样性。
3、利用后门规则,以共同原因U或中介变量A为条件也可以阻断后门路径,但是有可能造成D与Y之间因果关系消失,需要注意。
标签:偏差,混杂,结果,效应,个体,识别,共同,因果 From: https://www.cnblogs.com/fuxinzzz/p/18140186