
1. 项目概述当驱逐成为健康危机我们如何用数据量化其影响在金县华盛顿州——这片环绕西雅图的繁华之地住房危机与公共健康的交织并非抽象的社会议题而是每天上演的现实。作为全美无家可归者人数第三多的地区这里的数据背后是成千上万家庭在租金飙升、政策变动与生存压力下的挣扎。驱逐这个法律术语对经历者而言往往意味着生活轨迹的骤然断裂并可能引发一系列深远的健康问题。但一个核心的因果问题摆在研究者面前驱逐经历本身究竟在多大程度上直接导致了更差的健康结局这不仅仅是学术探讨更是制定有效干预政策的关键。要回答这个问题传统的相关性分析显得力不从心。因为被驱逐者与未被驱逐者之间在收入、教育、种族等众多特征上本就存在系统性差异即“混杂因素”。简单地比较两组的健康差异会把由这些前置特征造成的差异错误地归因于驱逐。这就需要引入因果推断的框架。本项目便是一个将前沿因果推断方法——逆概率加权IPTW与G计算G-computation相结合——应用于真实社会政策评估的完整实践。我们以金县一项关于无家可归与住房的受访者驱动抽样调查数据为基础旨在剥离混杂估计“驱逐”这一“处理”对健康的平均处理效应ATE从而为“驱逐-健康”链条提供更可靠的证据。2. 核心方法论拆解为什么是IPTWG计算在观察性研究中我们无法像随机对照试验那样随机分配“驱逐”或“不驱逐”只能观察到已经发生的事实。因果推断的核心思想是构建“反事实”如果我们能为每个被驱逐的人找到一个在各方面特征都极其相似但未被驱逐的“影子”那么这两者健康结局的差异就可以更干净地归因于驱逐本身。IPTW和G计算正是实现这一思想的两种强大工具而将它们结合形成双稳健估计Doubly Robust Estimation则是本项目方法论的基石。2.1 逆概率加权IPTW给每个人重新“赋权”IPTW的核心思路非常直观通过统计学手段模拟一个“伪随机化”的实验环境。具体做法是为数据集中的每个个体计算一个权重这个权重是其实际接受的处理驱逐与否的逆概率。1. 倾向评分建模首先我们使用所有观察到的协变量如年龄、性别、种族、收入、教育程度等记作集合L通过逻辑回归模型来预测每个人“被驱逐”的概率这个预测概率就是倾向评分Propensity Score, PS。logit(Pr(A1 | L)) α0 α1L其中A1表示被驱逐A0表示未被驱逐。这个模型回答了“基于这个人的已知特征他/她被驱逐的可能性有多大”2. 计算逆概率权重对于实际被驱逐的个体A1其权重为1 / PS对于实际未被驱逐的个体A0其权重为1 / (1 - PS)。wi Ai / e(Li) (1 - Ai) / (1 - e(Li))这个权重的直观解释是一个特征使其被驱逐概率很低例如PS0.1但实际上却被驱逐了的人在数据中很“稀有”因此我们需要在分析中给予他/她更大的权重权重10来代表那些具有类似特征、通常不会被驱逐的群体。反之亦然。加权之后在加权样本中协变量L的分布在处理组被驱逐和对照组未被驱逐之间应该达到平衡仿佛处理是随机分配的一样。注意倾向评分模型的质量至关重要。模型必须包含所有同时影响处理分配驱逐和结局健康的混杂变量。遗漏关键混杂变量会导致估计偏倚。在我们的实践中我们纳入了人口学、社会经济地位、住房史等多个维度的变量。2.2 G计算回归标准化模拟全域干预G计算采取了另一种思路它先建立一个结局模型健康结局对处理变量和所有协变量的回归模型然后利用这个模型进行“反事实预测”。1. 建立加权结局模型为了利用IPTW已创造的平衡数据优势我们会在加权后的样本上拟合一个健康结局模型。通常也是一个逻辑回归模型logit(Pr(Y1 | A, L)) β0 β1A β2L β3(A × L)其中Y1表示不良健康结局。这个模型包含了处理变量A、协变量L以及它们的交互项可选用于处理效应异质性。2. 进行反事实预测这是G计算的精髓。我们利用上一步拟合好的模型为数据集中的每一个个体进行两次预测预测1反事实状态1将模型中该个体的处理变量A强制设定为1假设其被驱逐同时保持其原有的协变量L不变计算其预测的健康结局概率Y_i(A1)。预测2反事实状态0将模型中该个体的处理变量A强制设定为0假设其未被驱逐保持协变量L不变计算预测概率Y_i(A0)。3. 计算平均处理效应ATE对所有个体的两次预测结果分别求平均得到全人群在“全部被驱逐”和“全部未被驱逐”两种反事实情景下的平均健康结局概率。μ1_hat (1/n) * Σ [Y_i(A1)]μ0_hat (1/n) * Σ [Y_i(A0)]两者之差即为平均处理效应的估计值ATE_hat μ1_hat - μ0_hat这个ATE可以解释为如果对全人群施加“驱逐”干预相比于不施加其不良健康结局的平均概率会增加多少。2.3 双稳健性为什么“112”IPTW和G计算单独使用都要求其对应的模型倾向评分模型或结局模型设定正确才能得到无偏的因果估计。这在实践中很难百分百保证。而双稳健估计的魅力在于它结合了两种方法只要两个模型中至少有一个设定正确最终的ATE估计就是一致的即随着样本量增大偏差会趋于零。这为我们结论的可靠性上了一道“双保险”。在我们的实现中虽然未使用更复杂的增强逆概率加权AIPW但通过先进行IPTW再执行G计算或在加权样本上拟合结局模型同样继承了这种双稳健的性质特别是在使用逻辑回归这类标准连接函数时。3. 数据准备与变量工程实战再精妙的方法也离不开扎实的数据基础。本项目的数据来源于一项针对金县无家可归或住房不稳定人群的受访者驱动抽样调查。原始数据包含大量分类细致但需要整合的变量以下是关键的变量构建过程。3.1 住房状态的重分类从精细到实用原始数据中“昨晚睡眠地点”有超过20个类别从“自有公寓/房屋”到“户外帐篷”、“汽车内”、“收容所”等。对于分析而言过于分散的类别会降低统计效能且许多类别样本量很小。我们基于“居住稳定性”和“庇护所类型”两个维度将其重编码为一个三分类的核心变量稳定居住Permanent包括“自有住房如公寓、房屋”和“补贴性住房/住房券”。这部分人虽然可能面临经济压力但拥有相对固定的住所。受庇护Sheltered包括“过夜收容所”、“酒店/汽车旅馆”、“微型房屋非自建”。这部分人无固定住所但夜间有屋顶遮蔽。临时/无庇护Temporary/Unsheltered这是最不稳定的状态包括“借住沙发冲浪”、“户外帐篷或非帐篷”、“车辆内汽车或房车”、“公共设施/交通枢纽”、“未睡觉”等。这部分人暴露在环境中的风险最高。这种分类不仅简化了分析更在概念上区分了不同层次的住房不稳定性使其能作为一个有效的协变量或效应修饰因子纳入模型。3.2 种族与族裔的合并应对数据缺失的挑战种族和族裔信息通过两个独立问题收集出现了有意义的缺失模式。我们发现一部分受访者跳过了所有人口学问题这是常规的无应答。但另一部分人回答了其他敏感问题如物质使用、心理健康却唯独在种族/族裔上选择“不知道”或跳过。这很可能源于问卷设计将“西班牙裔/拉丁裔”仅作为族裔而非种族选项让一些主要以此身份认同的人感到困惑。我们的处理策略体现了对“无应答”的精细区分“不知道”视为有效应答这代表受访者接触了问题但无法在给定选项中归类本身包含信息不应简单删除。“拒绝回答”或跳过视为缺失这类数据从分析中排除。构建合并变量遵循美国人口普查的最新标准优先考虑族裔身份。任何自认为“西班牙裔/拉丁裔”的受访者无论其报告的种族是什么均归入“西班牙裔/拉丁裔任何种族”类别。非西班牙裔者则按其报告的种族分类。若种族为“不知道”或缺失但族裔明确为非西裔则归为“非西裔-种族未报告”。这种做法在遵循标准、保持概念清晰和保留足够样本量之间取得了平衡。3.3 驱逐经历的操作化定义暴露我们通过一个问题序列来捕捉驱逐经历“您是否曾被从租赁房产中驱逐”回答“是”的受访者会进一步被问及“是否是法院命令的正式驱逐”和“发生时您多大年龄”。这允许我们区分正式与非正式驱逐并计算“驱逐后的年数”当前年龄减去驱逐发生年龄。分析显示大多数受访者的驱逐经历并非遥远往事23%发生在过去4年内近60%发生在过去15年内。这支持我们将“驱逐”视为一个相对近期或中期的暴露事件其对健康的潜在影响更可能被观察到。4. 模型实施、诊断与结果解读4.1 实施步骤详解数据清理与变量准备完成上述变量重编码处理缺失值。对于分析模型中的变量我们采用列表删除法listwise deletion处理缺失。拟合倾向评分模型以“是否被驱逐”为因变量将所有选定的协变量包括重分类后的住房状态、种族/族裔、年龄、性别、收入、教育、网络大小等作为自变量拟合逻辑回归模型。使用该模型预测每个个体的倾向评分PS。计算IPTW权重并评估根据公式计算逆概率权重。随后必须进行关键诊断共同支持域检查绘制处理组和对照组的PS分布图如图3所示。理想情况下两组分布应有大面积重叠。如果存在大量PS接近0或1的个体意味着某些特征组合下个体几乎注定被驱逐或不被驱逐缺乏可比性可能需要考虑对权重进行截断如将大于0.95的权重设为0.95。协变量平衡评估计算加权前后每个协变量在处理组和对照组间的标准化均值差SMD和Kolmogorov-SmirnovKS统计量。SMD绝对值小于0.1、KS统计量接近0通常表明平衡良好。我们的诊断图如图5显示加权后大多数协变量的平衡性得到显著改善。拟合加权结局模型在应用了IPTW权重的样本上以“健康结局”为因变量“驱逐”为核心自变量并包含必要的协变量有时可省略因权重已平衡它们但纳入可提高效率并处理残余不平衡拟合加权逻辑回归模型。执行G计算使用上一步拟合的模型为每个个体预测其在A1和A0两种情景下的健康结局概率。计算ATE及置信区间对全样本的预测值平均得到μ1和μ0相减得ATE。由于权重和模型预测引入了不确定性必须使用稳健的方法计算置信区间如自助法bootstrap或基于M估计的稳健标准误。4.2 关键诊断图解读与实操心得图3倾向评分分布这张图是分析的“生命线”。如果两组PS分布完全分离则因果推断无法进行因为不存在可比个体。我们的图显示了两组有充分的重叠满足了共同支持假设。实操心得在分析前务必检查此图。如果重叠区域小需谨慎考虑结论的普适性或重新审视协变量选择是否遗漏了强预测处理的变量。图4网络大小分布加权前后对比网络大小是受访者驱动抽样设计中的关键变量通常与入选概率相关。有趣的是我们的数据显示驱逐状态与网络大小在加权前就几乎无关分布已对齐。加权后变化微小。这提示在本样本中驱逐经历并非由受访者在社交网络中的可见度差异所驱动这在一定程度上减轻了对抽样设计引入偏倚的担忧。注意事项在RDS数据中通常需要将网络大小作为核心协变量纳入倾向评分模型以调整选择偏倚。即使其与处理无关纳入也无害且是良好实践。图5协变量平衡图这是评估IPTW是否有效的“成绩单”。左图SMD显示加权后几乎所有协变量的标准化均值差点都更靠近0的竖线。右图KS统计量同样显示加权后差异减小。踩过的坑不要只依赖SMD。对于连续变量尤其是非正态分布的KS检验能更好地捕捉分布形状的差异。务必综合查看。如果某个重要协变量始终无法平衡说明倾向评分模型可能误设或者该变量与处理的关系太强需要反思模型或考虑其他方法如匹配。4.3 结果解读与政策含义假设我们的最终模型显示ATE估计值为0.1595% CI: 0.08, 0.22且具有统计学意义。这意味着在平衡了所有观察到的混杂因素后经历驱逐会使不良健康结局的平均概率增加15个百分点。例如如果基线风险是20%那么驱逐将使其上升到35%。这个发现具有明确的政策含义驱逐不仅仅是一个住房或法律事件更是一个重大的公共卫生事件。它强有力地支持了将“驱逐预防”如租金援助、法律咨询、调解服务作为公共卫生干预措施的必要性。金县已有的“驱逐预防与租金援助计划”EPRAP和“驱逐解决试点项目”ERPP正是基于此类证据的实践。我们的分析为这些项目的持续和扩大提供了量化的因果证据。5. 常见陷阱、稳健性检验与扩展思考5.1 因果推断的“阿喀琉斯之踵”未观测混杂这是所有观察性研究因果推断的终极局限。IPTW和G计算只能针对已测量并正确纳入模型的协变量进行调整。如果存在同时影响驱逐风险和健康结局但未被测量的变量例如童年的极端逆境、某种未诊断的慢性疾病、社会支持的细微质量我们的估计仍可能存在偏倚。应对策略进行广泛的敏感性分析例如评估需要多大的未观测混杂效应才能推翻当前结论E值计算或者在分析中引入工具变量如果可得。5.2 模型误设与权重极端值倾向评分模型误设如果逻辑回归的线性假设不成立或者遗漏了重要的交互项、非线性项PS估计就会不准。解决方案可以尝试更灵活的机器学习方法如随机森林、梯度提升、神经网络来估计倾向评分但需注意防止过拟合并确保共同支持域。极端权重问题当某些个体的PS非常接近0或1时其逆概率权重会变得极大导致分析结果被少数极端个体主导方差剧增。实操心得常规做法是对权重进行截断如将PS小于0.01的设为0.01大于0.99的设为0.99或使用稳定化权重分子为边际处理概率。务必报告是否进行截断及截断阈值。5.3 从ATE到异质性处理效应平均处理效应ATE告诉我们全人群的平均影响但政策往往需要针对特定群体。驱逐对健康的影响对年轻人和老年人、不同种族群体、有无子女的家庭是否一样扩展分析可以在结局模型中引入处理变量与关键协变量的交互项如前文模型中的β3(A × L)然后通过G计算来估计不同亚组的条件平均处理效应CATE。例如我们可以分别计算在“稳定居住”和“无庇护”两个亚组中驱逐的健康效应有何不同这能为精准干预提供更细致的蓝图。5.4 处理“死亡”权重与样本重叠在计算权重后如果发现大量个体的权重异常高如10需要警惕。这通常意味着倾向评分模型在某些区域拟合不佳或样本中确实存在可比性很差的个体。检查清单重新检查倾向评分分布图的重叠情况。审查那些获得极高权重的个体的原始特征看他们是否属于某个极端子群。考虑使用重叠权重Overlap Weighting等方法其目标估计量是样本中具有最大重叠即可比性最强的那部分群体的平均处理效应通常能产生更稳定的估计和更小的方差。通过这个从数据构建、方法原理、实操步骤到诊断反思的完整流程我们不仅完成了一次严谨的政策评估分析更搭建了一个可复现的因果推断分析框架。这个框架的核心精神在于对数据保持敬畏对模型假设保持清醒对结论的局限性保持坦诚最终让数据成为推动社会向更公平、更健康方向发展的有力工具。