首页 > 其他分享 >如何解释无统计学显著性的结果?可以考虑用置信区间(CI)

如何解释无统计学显著性的结果?可以考虑用置信区间(CI)

时间:2024-08-16 09:57:00浏览次数:19  
标签:置信区间 CI 显著性 治疗 研究 MCID 统计学

很多医学研究的目标是为了确定两种或多种治疗方法中哪一种治疗方法对某个特定的疾病更有效。一项研究的统计学把握度(power),又称检验效能,是指在一定程度上能够检验出具有真正治疗效果的概率,它高度依赖于研究的样本量大小

当采用回顾性观察性研究设计时,研究人员几乎无法控制样本量的大小,因此也无法控制检验特定治疗效果的能力。当此类研究无法得出具有统计学显著性的结果时,我们就需要考虑一个重要的问题:缺乏统计学显著性到底是由于不同治疗方法之间效果确实没有差异,还是由于研究本身的把握度不足所致

为了解决这个问题,一些研究人员可能会考虑对已完成的研究进行把握度计算。但是,一旦研究已经完成,再去计算把握度可能就没有太大意义了。因此,对于所有的研究设计,当得出无统计学显著性的结果时,使用置信区间(CI)也许有助于我们对结果进行解释

2018年,Hung等研究者在《JAMA Surgery》上发表了一项研究结果[1],针对持续性或复发性甲状腺乳头状癌患者,对比分析了再次手术并接受放射性碘治疗和再次手术但未接受放射性碘治疗两种治疗方法,与肿瘤再次复发时间的相关性[1]。

该回顾性队列研究共纳入了102名患者,分析结果显示两种治疗方法之间的差异并没有达到统计学显著性

作者进行了检验效能分析,以确定在类似该研究的样本量中,按照80%的检验效能可以检测出的效应值。研究最终得出结论,再次手术并接受放射性碘治疗与无疾病复发生存期显著延长不具有关联性。

研究人员指出,该研究可能并没有足够的把握度来检测出再次手术后接受放射性碘治疗的效果。研究人员在文章中采用了HR及其95% CI来报告肿瘤复发的风险。

置信区间(CI)是什么?

在进行两种治疗方法效果比较的统计分析中,统计学显著性水平通常设置为0.05或5%,如果使用当前的数据进行分析,零假设不会被拒绝,则95% CI将包含所有治疗效果的可能值[2]。

CI可以被认为是一个“相容性区间”,它包含了与当前数据最相容的效应值,当我们将观察到的数据与一系列假设的效应值进行比较时,可以通过得出没有显著性的P值来进行判断[3]。对于所有CI,对应的显著性阈值是100减去置信水平(即CI百分比符号前的数字)。因此,如果使用10%作为显著性阈值,则90% CI的数值与数据最兼容。

在解释无显著性结果时,为什么CI有用?

与其对统计结果采用二元解释,即是或否达到统计学显著性,使用CI可以对治疗组之间没有统计学显著性差异的效果(即阴性结果)进行更加丰富的解释。在很多医学研究中的结果比较中,有一些治疗效果并没有太大的临床意义。例如,血压降低或升高3mmHg,即使结果具有统计学显著性,但是在临床中并没有实际价值。

首先,我们要确定具有临床显著性的最小差值(Minimal clinically important difference, MCID)[4],研究人员就可以明确不具有临床意义的数值范围,通常对于连续变量,以0为中心,对于OR值或HR值,则以1为中心。如果在分析开始前,根据既往的研究结果来指定MCID,则可以极大地增强CI对研究结果的解释。

对于一个已经预先指定MCID但并没有得出显著性结果的研究,将可能出现3种情况,如下图所示。在此示例中,治疗获益的MCID和治疗有害的MCID的绝对值是相等的,但情况并非一定如此。3种情况的CI都包含了0,因此,效应值都不具有统计学显著性,研究将被解释为具有阴性或中性结果。然而,由于预先指定了特定的MCID,每个CI都有不同的解释

图片

 

区间A仅包含介于治疗有害的MCID和治疗获益的MCID之间的数值,对于这种情况的结果,可以解释为治疗效果不具有临床意义。

区间B的取值范围包括了区间A,以及大于治疗获益的MCID的数值。对于这种情况的结果,可以解释为治疗效果不具有伤害性,包括无治疗效果和治疗获益。

区间C包括区间B,以及大于治疗有害的MCID绝对值。对于这种情况的结果可以解释为治疗效果包括临床无效,以及有意义的治疗获益和治疗伤害。即使在无法预先指定MCID的情况下,仍然可以通过描述CI的范围来增强对无统计学显著性结果的呈现

置信区间的局限性

尽管CI可以用来增强对研究结果的解释,但它们也有许多局限性[5]。例如,95%CI并不意味着有95%的概率会包含研究结局的真实值(例如,真实的治疗效果),这种说法在很多地方被错误的描述。

如果要建立一个包含真实值的指定概率区间,即概率区间,需要进行贝叶斯分析[6]。此外,95%CI内的数值并不是唯一可能产生当前数据和模型结果的数值,它们仅仅是最相容的数值。

上述的《JAMA Surgery》研究,

是如何应用置信区间来解释结果的?

在这项研究的统计分析部分,作者Hung等写到:“最后,我们对再次手术并接受放射性碘治疗的患者与再次手术但未接受无放射性碘治疗的患者之间的肿瘤再次复发差异进行了检验效能分析,我们确定有80%的把握度可以检测到22%的复发率差异”

(原文英文:Finally, we performed a power analysis with regard to our ability to detect a difference in second recurrences between patients who underwent reoperation with RAI vs patients who underwent reoperation without RAI; we determined that we had 80% power to detect a 22% difference in second recurrences.)

进行检验效能计算,是为了确定在一组50名患者和另一组52名患者的样本中,按照80%的检验效能可以检测到的最小效应值。在调整后的Cox比例风险回归模型中,结果显示HR为1.12,95% CI为0.43-2.98(P=0.81)。

根据事后的把握度计算,作者得出结论,“再次手术并接受放射性碘治疗与无疾病复发生存期显著延长不具有关联性,但也可能存在低于22%的差异。”

(原文英文:reoperation with receipt of RAI is not associated with a significant prolongation of recurrence-free survival. A difference of less than 22% remains possible.)

基于上述原因,Hung等人对数据的另一种呈现方式,是用对CI的解释来代替事后的检验效能分析。“与再次手术但未接受放射性碘治疗的患者相比,再次手术并接受放射性碘治疗的患者,肿瘤再次复发的HR的范围为0.43(较低的复发风险)至2.98(较高的复发风险)”。

(英文原文:The outcomes of patients undergoing reoperation with receipt of RAI were consistent with hazard ratios ranging from 0.43 (lower risk of recurrence) to 2.98 (higher risk of recurrence) compared with reoperation without RAI.)

在既往研究的基础上,预先设定MCID值,可以获得进一步的信息来确定CI的范围是否包含具有临床意义的数值。

参考文献:

1.JAMA Surg. 2018;153(12):1098-1104.

2. Glossary of statistical terms. https://hbiostat.org/doc/glossary.pdf

3. Am Stat. 2019;73(Sup 1):262-270.

4. JAMA. 2014;312(13):1342-1343.

5. Eur J Epidemiol. 2016;31(4):337-350.

6. JAMA. 2017;318(16):1605-1606.

标签:置信区间,CI,显著性,治疗,研究,MCID,统计学
From: https://blog.csdn.net/qazplm12_3/article/details/141225065

相关文章

  • Efficient DETR:别再随机初始化了,旷视提出单解码层的高效DETR | CVPR 2021
    EfficientDETR结合密集检测和稀疏集合检测的优点,利用密集先验来初始化对象容器,弥补单层解码器结构与6层解码器结构的差距。在MSCOCO上进行的实验表明,仅3个编码器层和1个解码器层即可实现与最先进的目标检测方法竞争的性能,在CrowdHuman密集数据集上的性能也远远优于其它检......
  • Python - SOLID Principles
    •Singleresponsibilityprinciple(SRP)•Open-closedprinciple(OCP)Itemphasizesthatsoftwareentities, suchasclassesandmodules,shouldbeopenforextensionbutclosedformodification.Whatdoes thatmean?Itmeansthatonceasoftwareentityis......
  • Cisco Nexus 9000v Switch, NX-OS Release 10.5(1)F - 用于网络原型设计和学习研究的
    CiscoNexus9000vSwitch,NX-OSRelease10.5(1)F用于网络原型设计和学习研究的虚拟化数据中心交换机请访问原文链接:https://sysin.org/blog/cisco-nexus-9000v/,查看最新版。原创作品,转载请保留出处。ReleaseDateNX-OSSystemSoftwareReleaseDateCiscoNX-OSRe......
  • DWC3和XHCI的区别
    DWC3(DesignWareUSB3.0Controller)和XHCI(eXtensibleHostControllerInterface)都是与USB控制器相关的技术,但它们的作用和实现层次有所不同。1.DWC3(DesignWareUSB3.0Controller)芯片级别的USB控制器:DWC3是由Synopsys设计的USB控制器IP,用于集成到SoC(系统级芯片)中。它是一个......
  • (路由卷1)-3-CCIE_RIP综合实验
    1.configureripv2onallroutersandadvertisetheirdirectlyconnectedinterfaces.ensurethattheseroutershavefullnlritoalltheloopbackinterfaceadvertisedintorip.ensurethatallrouterscanpingallloopbacks.configureripnottoadvertiseon......
  • (路由卷1)-2-CCIE_RIP综合实验
    rip分解实验物理拓扑图需求:ip地址分配情况;r1-r2-r3=123.1.1.0/24,r2-r3-r4=10.1.234.0/24,r4-r5=45.1.1.0/24如:r2-f0/0=10.1.234.2/24,r5-s1/3=45.1.1.5/24其他网段ip地址配置同理,每台路由器各有一个lo0,地址分别是:x.x.x.x/24(x是你的路由器号),在r1上添加4个换回接口,模拟r......
  • (路由卷1)-15-CCIE_EIGRP综合实验
    eigrp综合实验fr:ip地址分配情况:r1-r2-r3=123.1.1.0/24,r2-r3-r4=10.1.234.0/24,r4-r5=45.1.1.0/24如:r2-f0/0=10.1.234.2/24,r5-s1/3=45.1.1.5/24其他网段ip地址配置同理,每台路由器各有一个lo0其他网段ip地址配置同理,每台路由器各有一个lo0,地址分配是:x.x.x.x/24(x是你的......
  • mysql数据库中decimal数据类型比较大小
    在MySQL中,DECIMAL数据类型用于存储精确的数值,它非常适合用于需要高精度计算的场景,如金融应用。当我们需要在MySQL数据库中比较DECIMAL类型数据的大小时,可以使用标准的比较运算符,如>,<,>=,<=,=和<>(或!=)。以下是一个详细的示例,说明如何在MySQL中使用DECIMAL数据类型并比较......
  • Python - Foundational Design Principles
    EncapsulateWhatVariesOneofthemostcommonchallengesinsoftwaredevelopmentisdealingwithchange.Requirements evolve,technologiesadvance,anduserneedsalsochange.Therefore,itiscrucialtowritecodethat canadaptwithoutcausingaripple......
  • mysql数据库中decimal数据类型比较大小
    在MySQL中,DECIMAL数据类型用于存储精确的数值,它非常适合用于需要高精度计算的场景,如金融应用。当我们需要在MySQL数据库中比较DECIMAL类型数据的大小时,可以使用标准的比较运算符,如>,<,>=,<=,=和<>(或!=)。以下是一个详细的示例,说明如何在MySQL中使用DECIMAL数据类型并比较它......