分类资料全局最优倾向性评分区间匹配的研究与应用

分类资料全局最优倾向性评分区间匹配的研究与应用

论文摘要

研究背景:随机对照试验(Randomized Controlled Trial,RCT)被认为是证据等级最高的研究设计,是研究因果效应(Causal Effect)的金标准。但RCT研究并不能解决医学研究中的所有问题。由于观察性研究(observational study)不对研究对象进行随机分组,并且相对RCT更加节省费用和时间,因此越来越受到生物医学科研人员的关注。但观察性研究的研究对象基线变量在各个分组间存在着明显差异,存在混杂偏倚,从而影响处理效应估计(estimation of treatment effects)的准确性。倾向性评分法(Propensity Score,PS)是常见的可以用来控制可观测混杂的方法,其中,倾向性评分匹配法(Propensity Score Matching,PSM)应用最为广泛。PSM的基本思想是将PS相同或相近的处理组与对照组对象进行匹配,从而使得匹配后两组对象基线协变量均衡可比,控制混杂效应对处理效应估计的偏倚。为了控制匹配质量,只有处理组与对照组对象的PS距离小于设定好的一个值(卡钳值,caliper)时,才能形成匹配,该匹配方法称为倾向性评分卡钳匹配(Propensity Score Caliper Matching,PSCM)。此时由于部分处理组对象无法再对照组中找到PS距离小于卡钳值的对象从而排除匹配,因此会损失部分的样本。样本量损失的多少与卡钳值设置的大小有关。传统的PSM使用的是PS的点估计,未考虑抽样误差,损失了部分倾向性评分的信息。因此有学者提出使用倾向性评分的置信区间(confidence Interval,CI)进行匹配,称为倾向性评分区间匹配(Propensity Score Interval Matching,PSIM)。PSIM能使匹配率得到显著提升,尤其是在样本量较小的情况下。但可能导致匹配后组间协变量均衡性变差。基于运筹学整数规划问题中的指派问题(assignment problem)基本思想所构建的全局最优匹配(global optimal matching),着眼于使所有形成配对对象的倾向性评分距离之和达到最小或倾向性评分置信区间重合度之和达到最大,从而提高匹配质量,增加组间协变量的均衡性。因此,本研究将全局最优匹配算法用于优化PSIM,构建全局最优的倾向性评分区间匹配(Global Optimal Propensity Score Interval Matching,GOPSIM)算法,在增加匹配率的同时进一步平衡组间协变量,并将该算法扩展到处理因素为无序三分类的情形,以满足实际研究中的需要。研究目的:观察性研究中存在较强混杂效应或样本量较小的情形下,使用PSCM会损失较多样本。若不使用卡钳匹配,组间协变量的均衡性就可能较差。本研究针对这一系列问题,提出能提高匹配率、提升效应估计准确度以及增加统计效率的PSIM方法。并将能进一步优化匹配质量,提升匹配后基线均衡性的基于“指派问题”的全局最优算法应用于PSIM中。并将该匹配算法从处理因素为两分类扩展到无序三分类的情形。通过数据模拟研究,探索最优的PSIM的卡钳重合度,以及评价全局最优倾向性评分区间匹配的估计效应的准确性和精确性,从而构建最优的匹配算法。再将优化后的匹配算法应用于第五次全国卫生服务调查(上海地区)的实例研究中。研究方法:1.匹配算法构建本研究分别针对对两分类和无序三分类两种处理因素类别数,从优化性能(局部最优、全局最优)、匹配方法(点估计匹配、置信区间匹配)和卡钳设置情况(卡钳值、卡钳区间)等3个方面的不同水平组合进行匹配算法的构建,各构建2*2*2=8种匹配算法,共计16种。2.模拟数据集生成(1)两分类处理因素首先生成自变量,根据变量关系矩阵生成18个自变量,其中9个服从发生事件率为0.5的伯努利分布的两分类自变量X1-X9,以及9个服从均数为0,方差为1的正态分布连续性自变量X10-X18。使用logit函数和伯努利函数,并根据混杂效应的三种强度生成两分类处理变量,调整常数项使接受处理的对象比例控制在30%左右。最后,根据结局变量和处理变量与协变量的相关关系,使用logit函数和伯努利函数生成两分类结局变量,调整常数项使发生结局的比例控制在20%左右。两分类处理因素的模拟研究设置了3种样本量大小(200、500和1000)、3种混杂效应大小、6种处理效应大小共3*3*6=54种情形。每个情形生成1000个数据集,共产生了54,000个模拟数据集。(2)无序三分类处理因素自变量的生成跟处理因素为两分类一致。使用logit函数和多项分布函数,并根据混杂效应的三种强度生成三分类处理变量,调整常数项使三个处理水平发生的比例控制在2:3:5左右。最后根据处理变量、协变量和结局变量的关系,logit函数和伯努利函数生成两分类的结局变量,调整常数项使结局变量发生的比例控制在20%左右。无序三分类处理因素的模拟研究设置了2种样本量(500和1000)、3中混杂效应大小、两种处理效应大小,共2*3*2=12种情形。每种情形生成1000个数据集共12,000个模拟数据集。3.匹配算法的评价本研究根据以下7种评价指标来评价不同匹配算法的表现性能,包括:处理效应估计的绝对偏倚(absolute bias)、处理效应估计的相对偏倚(percent bias)、处理效应估计的方差(variance)、处理效应估计的均方误差(mean squared error)、处理效应估计的95%置信区间覆盖率(coverage of 95%CI)、匹配率和协变量组间标准化差异(standardized difference)。使用一般线性模型(general linear model,GLM)估计不同匹配方法7个评价指标的边际均数(marginal means),从而判断不同匹配方法的匹配性能的优劣。4.实例分析以上海区第五次国家卫生服务调查数据作为实例分析部分的资料来源。处理因素为二分类的实例为上海市郊区65岁以上独居老人与非独居老人的自评健康状况差异;处理因素为无序三分类的实例为上海市某区参保三种不同基本医疗保险的65岁以上老年女性居民的卫生服务利用情况比较分析。研究结果:1.模拟研究结果(1)倾向性评分区间匹配(1)处理因素为两分类两分类处理的局部最优匹配共四种,分别是两分类倾向性评分最邻近匹配(PSNNM2)、倾向性评分卡钳匹配(PSCM2)、倾向性评分最大区间重合度匹配(PSMIOM2)和倾向性评分区间匹配(PSIM2)。这4种匹配方法均能很大程度上降低处理效应的估计偏倚,并使得协变量在组间相对均衡。在未进行匹配时,处理效应估计的绝对偏倚和相对偏倚均很大。PSNNM2、最优卡钳值的PSCM2和PSMIOM2较其他方法绝对偏倚和相对偏倚均较大。其余匹配方法均能达到非常好的处理效应估计准确性。除了PSMIOM2外,其余匹配方法均能使协变量达到均衡状态。PSIM2绝对偏倚的绝对值在大多数的卡钳区间下均小于最优卡钳匹配,且有较高的匹配率。随着卡钳区间的减小,绝对偏倚也随之增加,当卡钳区间为0.60时绝对偏倚最接近0。此外,随着卡钳区间的增加,匹配率的逐渐下降。相反地,组间均衡性却增加。匹配率和协变量的组间均衡性互相矛盾,匹配率的增加会使协变量组间均衡性变差。(2)处理因素为无序三分类无序三分类处理的局部最优匹配共四种,分别是处理因素为无序三分类倾向性评分最邻近匹配(PSNNM3)、倾向性评分卡钳匹配(PSCM3)、倾向性评分最大区间重合度匹配(PSMIOM3)和倾向性评分区间匹配(PSIM3)。对于不同卡钳区间的PSIM3,随着卡钳区间的增加,协变量的平均标准化差异随之降低。相应地,匹配率也会随之下降。当实际数据的三个处理组的基线协变量差异较大时,模拟研究结果显示,卡钳区间设置为2.8时,可以更好地控制组间协变量的均衡性。反之,当基线协变量较均衡时,可以选取2.4作为卡钳区间来保证较高的匹配率,使得更多的对象可以形成匹配。(2)全局最优倾向性评分匹配(1)处理因素为两分类变量两分类的全局最优倾向性匹配共四种:两分类处理全局最优倾向性评分最邻近匹配(GOPSNNM2)、全局最优倾向性评分卡钳匹配(GOPSCM2)、全局最优倾向性评分最大区间重合度匹配(GOPSMIOM2)和全局最优倾向性评分区间匹配(GOPSIM2)。GOPSMIOM2的处理效应估计的绝对偏倚和相对偏倚均较大,但其处理效应估计的方差与其他匹配方法差不多。由于偏倚较大的原因,该匹配方法的均方误差较大、处理效应估计的95%置信区间覆盖率较低、协变量的组间均衡性较差。在各种卡钳区间重合度的GOPSIM2中,随之卡钳值的增加,处理效应估计的绝对偏倚也随之增加。匹配率和协变量平均标准化差异均随着卡钳区间重合度的增加而增加。当卡钳区间重合度为0.45时,匹配率较低,此时的平均标准化差异最小当卡钳区间重合度为0.90时,匹配率较高,此时的协变量平均标准化差异为5.02%,也远远小于10%的阈值。总的来看,所有匹配方法均能得到一个偏倚较小的处理效应估计。绝对偏倚最大的匹配方法是GOPSMIOM2,最小的是GOPSIM2-60。相对偏倚与绝对偏倚相类似。各个匹配方法的处理效应估计的方差均较小且很接近。基线协变量的平均标准化差异和匹配率呈正比关系。在没有进行卡钳区间筛选之前,协变量的平均标准化差异较大。通过卡钳区间的筛选,协变量的平均标准化差异显著下降。随着卡钳区间重合度的增加,平均标准化差异逐渐下降。匹配率也随之减小。总体来看,GOPSIM2-90的标准化差异较小,匹配率较高。(2)处理因素为无序三分类变量在GOPSCM3和GOPSNNM3中,不同匹配方法得到的处理效应估计的绝对偏倚和相对偏倚相对接近。绝对偏倚最大的匹配方法为卡钳值0.01的GOPSCM3。绝对偏倚最小的匹配方法是卡钳值0.02的GOPSCM3。处理效应估计的方差与偏倚的大致呈反比,偏倚越小方差越大。不同匹配方法间方差的差异不大。基线协变量的平均标准化差异和匹配率呈正比,匹配率越高,平均标准化差异也越大。GOPSNNM3的匹配率100.00%,随着卡钳值从0.5减小到0.01,匹配率从99.04%下降到56.47%,平均标准化差异从18.62%下降为6.44%。除了卡钳值为0.01的GOPSCM3,其余所有匹配方法协变量平均标准化差异小于10%,可认为协变量均衡可比。在GOPSMOIM3和GOPSIM3中,绝对偏倚最大的匹配方法是GOPSMIOM3(0.096),最小的是GOPSIM3-75(0.069)。相对偏倚与绝对偏倚相类似,也是GOPSMIOM最大(5.903%),GOPSIM3-75最小(4.384%)。各个匹配方法的处理效应估计的方差均较小,基本在0.075附近。由于GOPSMIOM3的处理效应的偏倚和方差均较大,因此其处理效应估计的均方误差也最大(5.094)。7种卡钳区间的GOPSIM3的均方误差较接近。基线协变量的平均标准化差异和匹配率呈正比关系。在没有进行卡钳区间筛选之前,协变量的平均标准化差异较大(16.14%),大于了10%的推荐阈值。通过卡钳区间的筛选,协变量的平均标准化差异显著下降。总体来看,GOPSIM3的标准化差异较小,匹配率较高。2.实例研究结果(1)上海市郊区65岁以上空巢老年居民自评健康状况研究排除了协变量或处理变量存在缺失的居民,最终477名独居老人和902名非独居老人纳入倾向性评分估计的模型。PSNNM2、PSMIOM2、GOPSNNM2和GOPSMIOM2的匹配率均为100%,GOPSCM2的匹配率最低,为38.99%,PSIM2匹配率最高45.49%。协变量平均标准化差异(Standardized Difference,SD)在匹配前为23.01%,四种没有设置卡钳值和卡钳区间,因此,这四种方法的协变量平均SD比较大,均大于10%。PSCM2的平均SD最小为5.28%。使用Wilcoxon秩和检验比较独居老人和非独居老人的自评健康状况,在匹配前,独居老人和非独居老人的自评健康差异有统计学意义,P<0.0001。但在进行PSM后,8种匹配方法的结果均为独居老人和非独居老人的自评健康状况差异无统计学意义(P值均大于0.05)。区间匹配能比点估计的匹配增加一定的匹配率,例如把PSCM2的匹配率从41.51%提升到PSIM2的45.49%,把GOPSNNM2的38.99%提升到GOPSIM2的44.86%。但是,协变量的标准化差异变化不大,增加了不到2%。说明不论是否联合和全局最优匹配的算法,区间匹配能在几乎不影响协变量组间均衡性的情况下,一定程度的提升匹配率,尤其是在样本量比较小,或者两个处理组间协变量分布差异较大时,优势更加明显。(2)上海市某区老年女性居民医保类型对卫生服务利用的影响本实例研究对象纳入标准为上海市某区65岁以上老年女性居民,若其基本医疗保险参保情况缺失则排除本实例研究。通过整理数据,本实例共纳入了532名参保城镇职工基本医疗保险居民、343民城镇居民基本医疗保险参保居民以及235名新农村合作医疗系统参保居民,共1110人。PSNNM3、PSMIOM3、GOPSNNM3和GOPSMIOM3的匹配率为100%。但这四种匹配方法的协变量均衡性较差,均大于了10%,但显著地低于匹配前的27.88%。PSIM3的匹配率在其余的四种匹配方法中最高,达到了58.88%。GOPSCM3的匹配率最低,仅为42.26%。通过卡钳值或卡钳区间的控制,这四种匹配方法的协变量均衡性有了很大的提升,协变量平均SD均小于了10%。其中GOPSCM3的协变量均衡性最好,平均SD仅为6.42%。在匹配前,由于存在大量混杂偏倚,未能检验出三组间的两周就诊率的差异。但在经过PSM后,PSNNM3、PSIM3、GOPSNNM3和GOPSMIOM3卡方检验的P值均小于0.05,认为参保三种医保类型的居民两周就诊率差异有统计学意义。与模拟研究相类似,PSNNM3、PSMIOM3、GOPSNNM3和GOPSMIOM3四种匹配方法没有设置卡钳值或卡钳区间,匹配率为100%,但这四种方法的协变量均衡性就稍差一些。其余四种方法设置了卡钳值或卡钳区间,因此协变量均衡性有所提升。使用PSNNM3匹配有统计学意义,而设置了卡钳值后PSCM3就没有统计学意义了。这可能是由于设置了卡钳值后导致了样本量的损失,使得检验效率降低。但是,使用了区间匹配后,PSIM3的匹配率比PSCM3高出了一些,提升了部分的检验效率,因此又检验出了统计学差异。研究结论:卡钳区间为0.60的PSIM2在探索的16种卡钳区间的PSIM2中有着最优的表现。因此,通过本研究的模拟实验,推荐在进行PSM时,尤其是样本量比较小的时候,使用卡钳区间为0.60的PSIM2能得到较好的匹配。随着卡钳值的减小或卡钳区间重合度的增加,PSCM3或PSIM3的组间协变量均衡性会变的更均衡,但是匹配率会随之下降。通过权衡两者,并且结合处理效应估计的指标,本研究推荐使用卡钳区间为2.6的PSIM3进行处理效应为无序三分类的PSM。通过实例研究,进一步验证了匹配算法有着较好的表现性能。经过8种两分类倾向性评分匹配分析,上海郊区65岁以上独居与非独居老年女性居民的自评见状况差异均无统计学意义,敏感性分析的结果也显示差异无统计学意义。使用8种无序三分类倾向性评分匹配分析上海市某区65岁以上老年女性居民医保类型对两周就诊率是否存在差异。经过PSNNM3、PSIM3、GOPSNNM3和GOPSMIOM3后,假设检验P值小于0.05,说明参保三种基本医疗保险的居民的两周就诊率差异有统计学意义。敏感性分析结果也得到类似的结果。

论文目录

  • 摘要
  • Abstract
  • 缩略词表
  • 第一部分 概述
  •   一、研究背景
  •     (一)观察性研究和随机对照试验
  •     (二)混杂偏倚的控制
  •     (三)倾向性评分匹配法存在的问题
  •     (四)区间匹配的概念
  •     (五)基于指派问题的最优化算法
  •     (六)多个处理组的匹配
  •   二、研究目的和意义
  •     (一)研究目的
  •     (二)研究意义
  • 第二部分 主要研究内容、方法和步骤
  •   一、研究内容
  •     (一)匹配算法的构建
  •     (二)模拟数据集的产生
  •     (三)匹配算法的评价
  •     (四)实例应用
  •   二、技术路线
  •   三、资料来源与研究平台
  • 第三部分 分类资料全局最优倾向性评分区间匹配算法的构建
  •   一、倾向性评分最邻近匹配
  •     (一)PSNNM2
  •     (二)PSNNM3
  •     (三)GOPSNNM2
  •     (四)GOPSNNM3
  •   二、倾向性评分卡钳匹配
  •     (一)PSCM2
  •     (二)PSCM3
  •     (三)GOPSCM2
  •     (四)GOPSCM3
  •   三、倾向性评分最大卡钳区间重合度匹配
  •     (一)PSMIOM2
  •     (二)PSMIOM3
  •     (三)GOPSMIOM2
  •     (四)GOPSMIOM3
  •   四、倾向性评分区间匹配
  •     (一)PSIM2
  •     (二)PSIM3
  •     (三)GOPSIM2
  •     (四)GOPSIM3
  • 第四部分 倾向性评分区间匹配最优卡钳重合度的探索
  •   一、两分类处理因素
  •     (一)模拟数据集的产生
  •     (二)匹配算法的评价
  •     (三)最优卡钳重合度的探索
  •     (四)小结
  •   二、无序三分类处理因素
  •     (一)模拟数据集的产生
  •     (二)算法的评价
  •     (三)最优卡钳重合度的探索
  •     (四)小结
  • 第五部分 全局最优倾向性评分匹配表现性能的探索
  •   一、处理因素为两分类
  •     (一)全局最优倾向性评分卡钳匹配算法评价
  •     (二)全局最优倾向性区间匹配算法评价
  •   二、处理因素为无序三分类
  •     (一)全局最优倾向性评分卡钳匹配算法评价
  •     (二)全局最优倾向性评分区间匹配算法评价
  • 第六部分 实例研究
  •   一、上海市郊区65岁以上空巢老年居民自评健康状况情况
  •     (一)研究背景
  •     (二)研究方法
  •     (三)研究结果
  •     (四)讨论
  •   二、上海市老年女性居民医保类型对卫生服务利用的影响
  •     (一)研究背景
  •     (二)研究方法
  •     (三)研究结果
  •     (四)讨论
  • 第七部分 研究结论与展望
  •   一、研究结论
  •   二、研究特色和创新点
  •   三、研究的局限性与尚待完善的方向
  • 参考文献
  • 附录 附图
  • 文献综述
  •   一、有放回和无放回的匹配
  •   二、贪婪匹配和最优匹配
  •   三、卡钳匹配
  •   四、多个处理组的匹配
  •   五、1:M匹配
  •   六、成对匹配和完全匹配
  •   七、区间匹配
  •   八、结语
  •   参考文献
  • 在读期间发表论文和参加科研工作情况
  • 致谢
  • 文章来源

    类型: 博士论文

    作者: 郭轶斌

    导师: 贺佳

    关键词: 倾向性评分,区间匹配,全局最优,因果推断

    来源: 中国人民解放军海军军医大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,医药卫生方针政策与法律法规研究

    单位: 中国人民解放军海军军医大学

    分类号: O221.4;R195.1

    总页数: 156

    文件大小: 9577K

    下载量: 133

    相关论文文献

    • [1].二次0-1规划问题的全局最优条件[J]. 应用数学与计算数学学报 2018(03)
    • [2].全局最优的邻域估计[J]. 控制与决策 2012(08)
    • [3].一种带搜索因子的全局最优人工蜂群算法[J]. 重庆理工大学学报(自然科学) 2017(06)
    • [4].一类特殊六次规划问题的全局最优充分条件[J]. 湖北民族学院学报(自然科学版) 2018(04)
    • [5].Buck变换器的全局最优滑模控制器设计[J]. 洛阳理工学院学报(自然科学版) 2010(03)
    • [6].一种基于全局最优MPPT的混合控制策略研究[J]. 电力电子技术 2017(11)
    • [7].基于全局最优位置自适应选取与局部搜索的多目标粒子群优化算法[J]. 计算机应用 2014(04)
    • [8].具有相关噪声和不确定观测系统的全局最优Kalman滤波[J]. 哈尔滨理工大学学报 2015(04)
    • [9].一种新的QoS全局最优Web服务选择算法[J]. 微电子学与计算机 2013(03)
    • [10].基于多样性全局最优引导和反向学习的离子运动算法[J]. 控制与决策 2020(07)
    • [11].一种基于免疫小生境思想的粒子群优化算法[J]. 计算机工程与应用 2008(08)
    • [12].一种基于群体最优变化权重的改进粒子群算法[J]. 信息技术与信息化 2019(12)
    • [13].非线性规划问题的全局最优必要条件[J]. 应用数学与计算数学学报 2018(01)
    • [14].模糊C均值BP神经网络算法及其应用[J]. 中国农机化学报 2014(04)
    • [15].关于优化的一种算法[J]. 科技信息(科学教研) 2008(08)
    • [16].一种基于全局最优的改进的正弦余弦算法[J]. 河南科学 2020(01)
    • [17].一种改进的全局优化遗传算法[J]. 科技创新导报 2010(29)
    • [18].微分演化算法在桁架形状优化中的应用[J]. 土木建筑与环境工程 2010(01)
    • [19].一种基于全局最优MPPT算法的研究[J]. 电气传动 2015(12)
    • [20].基于边际效应全局最优的队列控制方法[J]. 云南大学学报(自然科学版) 2015(03)
    • [21].三维重构中一种快速全局最优算法[J]. 西北工业大学学报 2010(01)
    • [22].两跳放大转发中继网络中的ε-全局最优多中继选择策略[J]. 电信科学 2011(08)
    • [23].一种基于QoS全局最优的服务选择算法[J]. 计算机应用研究 2010(05)
    • [24].基于全局最优的快速人工鱼群算法及其应用研究[J]. 电子技术与软件工程 2016(07)
    • [25].面向多基线干涉SAR高程反演的全局最优相干方法[J]. 江西建材 2016(20)
    • [26].结合历史全局最优与局部最优的粒子群算法[J]. 华东理工大学学报(自然科学版) 2011(04)
    • [27].城市快速路分层分布式优化控制方法研究[J]. 交通运输系统工程与信息 2020(02)
    • [28].混合粒子群优化小波自适应阈值估计算法及用于局部放电去噪[J]. 高电压技术 2017(05)
    • [29].改进重置粒子群算法在MPC调速系统中的应用[J]. 微电机 2015(05)
    • [30].具有自适应全局最优引导快速搜索策略的人工蜂群算法[J]. 控制与决策 2014(11)

    标签:;  ;  ;  ;  

    分类资料全局最优倾向性评分区间匹配的研究与应用
    下载Doc文档

    猜你喜欢