也就是说总体数

据的比较结果并未对个体活跃程度进行控制,因而造成服务使用效果的评价中混入了活跃程度的影响。 从上例中,我们不能根据直观数据简单通过正负相关去推导因果关系:因为会存在可观测或不可观测的混淆变量对因果解释造成偏差。 因此,因果推断最主要的思路就是需要控制混淆变量。 控制混淆变量的最理想的方式即采用随机对照实验,因为随机分配使得干扰项条件均值独立于解释变量,

 

即解释变量与任何其他可能

 

的混淆变量都不相关,这种情况下解释变  澳大利亚电话号码  量与被解释变量之间不会存在混淆路径,二者的相关性能直接反映因果关系。 但出于种种原因,如时效性、费用成本、操作性困难等原因,我们可能不会有理想实验条件,只能通过既有的观察性数据去推断,这时候就需要使用计量方法去帮助我们做出因果推断。 二、因果推断的计量方法 以下将简要介绍种常用的因果推断计量方法 匹配法 基本原理:对于接受处置的个体,找到可观测特征相同的未被处置的个体,通过比较他们的观测结果的差异,

 

达到估计处置效应的目标。

成立假设: 条件独立假设:给定可观 爱沙尼亚电话号码  测特征后,潜在结果独立于处置状态; 共同支撑域条件:给定可观测特征 Xi x,个体接受处置的概率大于并小于。用于确保同时存在处置组和控制组 方法及操作步骤:匹配法主要可分为直接匹配法和倾向得分匹配法两种。直接匹配法:根据可观测的特征值直接匹配;如果可观测特征只包含少数几个非连续变量,可进行直接匹配,但当可观测特征维度增加时,要在多维进行直接匹配就存在操作性困难;倾向得分匹配法:

Leave a comment

Your email address will not be published. Required fields are marked *