一种新的单样本率的置信区间估计方法

一种新的单样本率的置信区间估计方法

论文摘要

背景:在医学研究领域,以二分类数据为结局的资料类型十分常见。对于此类数据的分析,应用中通常会给出效应量及效应量的置信区间,其中最常用的效应量包括:率、率差、率比、优势比等。单样本率的置信区间估计方法较多,以Wilson Score法的应用最为广泛,但均存在极端率情形下(接近0%或100%)置信区间覆盖率急剧下降的情况,即“downward spikes”现象。此外,不同方法还有着自身的局限,如Agresti-Coull提出的对于样本成功例数和失败例数分别加2的Agresti and Coull add 4 CI以及于样本成功例数和失败例数分别加z2的Agresti and Coull add z2 CI,Guan提出的广义Score法(Generalized Score CI),以及Yu提出的基于中点校正的Score法(Improved Score interval with a Modified Midpoint)等,虽然从不同的方面对Wilson Score CI有所改善,但是仍存在覆盖率不稳定、区间宽度过大等问题。在精确法中,Clopper-Pearson CI可以保证区间覆盖率不低于所设定的检验水准,但是该方法过于保守,Mid-P CI相对于Clopper-Pearson CI有所改善,但是结果仍较保守,而且精确法的计算量大,在应用上受到了一定的限制;Rubin和Schenke基于贝叶斯理论提出了Jeffrey CI,该方法能够解决在极端率的情况下区间覆盖率急剧下降的问题,但是其区间估计的结果过于保守,而且当事件发生率不接近0或者1时同样会出现“downwardspikes”现象。因此,目前并没有一种公认较好的单样本率的置信区间估计方法。两独立样本率差置信区间的构建相对于单样本率的情况更加复杂,虽然当前已有数十种方法被提出,但是这些方法自身均存在一定的不足。目前最常用的是Newcombe与1998年提出的Newcombe-Wilson Score CI,这种方法也受到了美国临床实验室标准化协会以及FDA指南的推荐。但是,当率接近0或100%的时候,Newcombe-Wilson Score CI较为保守。目的:本研究旨在基于Cornish-Fisher展开式结合Score法思想提出一种新的单样本率置信区间构建方法,并进一步将新方法推广到两独立样本率差置信区间的构建中,以期较现有方法的统计性能有明显改善。方法:(1)新方法的提出Comish-Fisher展开式是一种用于估计概率分布分位数的渐近展开方法,由Cornish和Fisher两位著名统计学家于1960年提出。其主要思想是通过概率分布的前n阶累积量和标准正态分布的分位数来近似估计概率分布的分位数。Wilson Score CI在极端率的条件下可能会出现覆盖率急剧下降的问题,其主要原因是当事件发生率接近0或1时,二项分布并非近似服从正态分布。因此,本研究考虑提出一种新的置信区间构建思想,在构建单样本率的置信区间时,舍弃传统的正态近似法,直接采用Cornish-Fisher展开式估计二项分布的分位数,希望以此避免近似正态分布时产生误差,提高结果的精确性。本研究将基于这种新思想构建的单样本率的置信区间命名为Cornish-Fisher CI。MOVER法(Method of Variance Estimate Recovery)是一种常用的率差/率比置信区间的构建策略,其主要思想是通过方差重估计(Variance Estimate Recovery)的方法将单样本率的置信区间“杂交”成两样本率差/率比的置信区间。我们将本研究提出的置信区间构建思想结合MOVER法构建出一种新的两独立样本率差的置信区间,并命名为Cornish-Fisher hybrid CI。(2)模拟研究在比较各种置信区间估计方法的优劣时,采用的评价指标包括置信区间的区间覆盖率、置信区间宽度、尾侧不覆盖率及其比值、最小区间覆盖率、均方误、平均置信区间宽度以及方法的计算复杂程度。对于单样本率的置信区间估计,本研究共纳入8种常见的方法包括:Wilson Score CI、Wald CI、Modified Midpoint CI、Generalized Score Cl、Agresti-Coull add z2 CI、Jeffrey CI、Mid-P CI、Randomized Plausible Interval,与新方法Cornish-Fisher CI进行模拟比较。对于两独立样本率差的置信区间估计,本研究重点考察当前使用最广泛的方法Newcombe-Wilson Score CI与新方法Cornish-Fisher hybrid CI 的优劣。结果:对于单样本率的置信区间估计,本研究提出的新方法在平均置信区间覆盖率、均方误及平均置信区间宽度等方面均表现最优,即在纳入比较的几种方法中,新方法在保证平均置信区间覆盖率的情况下,它的均方误及平均置信区间宽度是最小的。对于两独立样本率差的置信区间估计,当两事件发生率π1和π2接近0或1,即在(0,0.2](?)[0.8,1)范围内时,当前广泛推荐使用的Newcombe-Wilson Score CI存在过保守的问题,本研究新提出的Cornish-Fisherhybrid CI平均置信区间宽度小于Newcombe-Wilson Score CI,同时新方法的平均置信区间覆盖率更优,更接近置信水准1-α,故推荐使用新方法。结论:当事件发生率小于20%或大于80%时,本研究提出的置信区间估计新方法较常用的估计置信区间的Wilson Score CI方法有更优的统计性能。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 背景
  •   1.1 研究背景
  •   1.2 研究目的
  • 第二章 单样本率的置信区间构建
  •   2.1 常用的单样本率置信区间估计方法
  •   2.2 新方法
  •   2.3 模拟研究
  •   2.4 模拟结果
  •   2.5 实例分析
  •   2.6 讨论
  • 第三章 率差的置信区间构建
  •   3.1 常用的率差置信区间估计方法
  •   3.2 新方法
  •   3.3 模拟研究
  •   3.4 模拟结果
  •   3.5 实例分析
  •   3.6 讨论
  • 第四章 讨论与总结
  •   4.1 结果讨论
  •   4.2 缺点与不足
  •   4.3 后期展望
  • 参考文献
  • 附录
  • 图表目录
  • 中英文对照
  • 攻读学位期间成果
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 徐莹

    导师: 陈平雁

    关键词: 置信区间,二分类数据,单样本率,率差

    来源: 南方医科大学

    年度: 2019

    分类: 基础科学,医药卫生科技

    专业: 数学,医药卫生方针政策与法律法规研究

    单位: 南方医科大学

    分类号: R195.1;O212.1

    总页数: 87

    文件大小: 4019K

    下载量: 92

    相关论文文献

    • [1].非参数检验中的单样本符号检验[J]. 化学工程与装备 2020(04)
    • [2].基于变化稀疏表示的单样本人脸识别[J]. 信息工程大学学报 2017(02)
    • [3].基于深度卷积自编码器的单样本人脸识别[J]. 数码世界 2020(08)
    • [4].局部联合结构化稀疏表示的单样本人脸识别[J]. 计算机工程与应用 2018(01)
    • [5].基于镜像奇异值分解的单样本人脸识别[J]. 微型机与应用 2010(16)
    • [6].使用稀疏加权平均脸及对称脸解决单样本问题[J]. 计算机应用研究 2015(05)
    • [7].基于虚拟信息的单样本分块人脸识别[J]. 计算机工程与应用 2009(19)
    • [8].基于深度自编码器的单样本人脸识别[J]. 模式识别与人工智能 2017(04)
    • [9].人脸面部变化字典学习的单样本人脸识别问题[J]. 小型微型计算机系统 2015(09)
    • [10].一种基于产生式分数空间的单样本人脸识别方法[J]. 上海交通大学学报 2017(02)
    • [11].单样本人脸识别线性回归分类[J]. 计算机工程与设计 2014(12)
    • [12].基于虚拟样本扩张法的单样本人脸识别算法研究[J]. 科学技术与工程 2013(14)
    • [13].一种雷达信号的单样本压缩采样方法[J]. 信号处理 2019(06)
    • [14].基于稀疏重构扩充法的单样本人脸识别算法[J]. 杭州电子科技大学学报(自然科学版) 2019(02)
    • [15].通用学习框架在单样本人脸识别中的应用研究[J]. 计算机应用与软件 2014(08)
    • [16].基于虚拟信息的单样本分块人脸识别方法[J]. 数据采集与处理 2009(04)
    • [17].B样条和图像梯度的单样本人脸识别[J]. 重庆大学学报 2013(12)
    • [18].基于样本扩展和线性子空间特征提取的单样本人脸识别[J]. 应用科学学报 2013(05)
    • [19].深度子空间联合稀疏表示单样本人脸识别算法[J]. 燕山大学学报 2018(05)
    • [20].24小时尿液代谢和晨尿单样本尿液代谢检查:两者的相关性与一致性[J]. 泌尿外科杂志(电子版) 2010(02)
    • [21].基于SIFT特征的单样本人脸识别研究[J]. 信息工程大学学报 2008(02)
    • [22].深度稀疏自编码网络融合多LBP特征用于单样本人脸识别[J]. 物联网技术 2019(11)
    • [23].基于WSSRC单样本人脸识别及样本扩充方法研究[J]. 计算机测量与控制 2016(10)
    • [24].FLDA在单样本人脸识别中的应用研究[J]. 计算机应用与软件 2014(04)
    • [25].基于支持向量机和Candide-3的单样本人脸确认[J]. 计算机应用与软件 2010(06)
    • [26].基于单样本的ART神经网络训练算法[J]. 广西师范大学学报(自然科学版) 2008(03)
    • [27].自适应判别分析在单样本人脸识别中的研究[J]. 电视技术 2014(01)
    • [28].关于计量资料中的t检验[J]. 中国现代医生 2012(11)
    • [29].关于计量资料中的t检验[J]. 系统医学 2019(14)
    • [30].基于LBP特征和贝叶斯模型的单样本人脸识别[J]. 光电子.激光 2011(05)

    标签:;  ;  ;  ;  

    一种新的单样本率的置信区间估计方法
    下载Doc文档

    猜你喜欢