首页 > 其他分享 >生存分析常用的统计模型

生存分析常用的统计模型

时间:2023-08-27 09:55:30浏览次数:34  
标签:预后 风险 常用 变量 生存 Cox 模型

回复我们公众号“1号程序员”的“E001”可以获取《BAT机器学习面试1000题》下载链接。[关注并回复:【E001】] 

生存分析,是将观察结局和出现这一结局所经历的时间结合起来分析的一种统计分析方法,已经被广泛地应用于癌症数据分析领域,来揭示疾病特征和预后结局的关系,为临床医生提供预后信息和临床决策支持。常用的生存分析方法有KM曲线法和Cox模型分析法。它们因为易操作性、易解读性和对生存数据的良好拟合特性而被广泛用于癌症的预后研究。但是,这两种方法有着相同的缺点:1)研究人员根据自己的经验,将连续型变量转为分类型变量带入模型进行分析。因此,这两种模型提供的是一个群体的预测信息,而不是个性化的预测信息;2)人为的分组方式也不一定是最优的;难以找到也无法确认一个最优的分组方式。同时,将连续型变量转变为分类型变量来处理,变量的非线性影响特性就会被忽略,可能会导致预后信息的丢失。发表在柳叶刀上的一篇关于胃肠道间质瘤复发风险的研究显示:肿瘤大小和核分裂相计数对胃肠道间质瘤的复发风险存在着显著的非线性影响;与常用的风险分层模型相比,利用非线性模型进行胃肠道间质瘤的复发进行预测具有更高的准确性。此外,能进行多变量分析的Cox模型还需要满足比例风险假设,不符合这个假设的数据应用Cox模型,可能会生成错误的模型和错误的结论。比例风险假设是指各个协变量对生存结局的风险值不随时间的改变而改变,即一个风险因素的取值一定时,该风险因素对生存结局的影响一直不变。已经有许多研究者发表了预测因子不符合比例风险假设的研究,比如雌激素受体和肿瘤大小对乳腺癌预后的影响,卡式评分对卵巢癌预后的影响等。

Cox在提出Cox模型的时候,就指出研究数据不符合比例风险假设的可能性,并给出了补偿方法,即把Cox比例风险模型中的时间变量用一个时间函数来代替,拟合协变量风险随时间变化的趋势。这种方法有一个显著的不足:时间函数的形式不确定,需要人工指定,难以找到且无法确认一个最优的时间函数。随着Cox模型的广泛使用和研究者对比例风险假设的忽视,许多统计学工作者强调验证比例风险假设的重要性,并致力于改进Cox模型,提出了改进的Cox模型,如Aalen additive风险模型、MA-additive风险模型和Accelerated failure time模型等。这些改进的模型是在时间函数的构建上属于半参数或非参数的模型,从而使得时间函数不需要人为指定,可以由模型多次迭代得到,但是仍然人为风险因素对生存结局的影响呈对数线性关系,难以拟合非线性的关系。

标签:预后,风险,常用,变量,生存,Cox,模型
From: https://www.cnblogs.com/sqchi1991/p/17659898.html

相关文章

  • 常用的linux命令
    《linux常用基础命令1.文件操作命令创建文件:touchfilename创建目录:mkdirdirName删除文件:rmfilename删除文件夹:rm-rfdirName文件复制:cp原始文件目标文件文件夹复制:cp-r原始目录目标目录文件移动:mvpath/sourceFileNamepath/targetFileName文件重命名:mvfil......
  • Stable diffusion webui炼指定的人物模型
    Stablediffusionwebui炼指定的人物模型1.打开自己的sd服务:修改自己的设置我本地的:http://192.168.1.4:7862/?__theme=dark修改设置--->训练:这个推荐勾上,会屏蔽vae文件,不然的话会出现很多问题反推提示词这里,不要勾选按字母排序了,取消勾选deepbooru上面的值选大过滤的标......
  • sharp.js的常用方法
    sharp.js是一个用于处理图像的JavaScript库,它提供了许多方法来操作和修改图像。以下是一些常用的sharp.js方法及其详细参数说明: 1.`resize(width,height)`:调整图像的宽度和高度。  -width(Number):新的宽度。  -height(Number):新的高度。 2.`crop(left,top,widt......
  • 1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4
    前言 数学的命运齿轮从此开始转动。国内首个专为数学打造的千亿级大模型MathGPT正式上线,在多项基准测试中碾压GPT-4,刷新SOTA。本文转载自新智元仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。......
  • 遇到的Docker常用命令
    遇到的Docker常用命令一、安装Docker1)Docker要求CentOS系统的内核版本高于3.10,首先查看系统内核版本是否满足uname-r2)使用root权限登录系统,确保yum包更新到最新sudoyumupdate-y3)假如安装过旧版本,先卸载旧版本sudoyumremovedockerdocker-commondocker-sel......
  • GPT人工智能模型的应用与优势
    近年来,GPT(GenerativePre-trainedTransformer)人工智能模型成为了人工智能领域的研究热点。GPT是一种基于自注意力机制的深度学习模型,它通过模拟人类的语言逻辑,可以生成高质量的自然语言文本。本文将详细介绍GPT人工智能模型的概念、工作原理以及在现实生活中的应用场景,带领读者了......
  • fs常用方法
    `fs`是Node.js中用于文件系统操作的模块。以下是一些常用的`fs`方法及其使用示例: 1.`fs.readFile(path,options,callback)`:读取文件内容。参数`path`是文件路径,`options`是一个可选的配置对象,`callback`是一个回调函数,当文件读取完成时调用。 ```javascriptcon......
  • 文章学习 | 大模型发展
    嬗变:大语言模型带来的人工智能新纪元|CCCF精选盖茨说:大语言模型创新的影响力可以与20世纪60年代的微处理器、80年代的个人电脑、90年代的互联网和21世纪初的苹果手机媲美。大模型的创新大语言模型是人工智能领域自然语言处理的一部分。在大语言模型出现之前,自然语言处理主......
  • 【面试宝典】Git 版本控制常用命令
    一.Git概述Git是目前世界上最先进的分布式版本控制工具,主要用于管理开发过程中的源代码文件(Java类、xml文件、html页面等),包括:代码回溯:Git在管理文件过程中会记录日志,方便回退到历史版本版本切换:Git存在分支的概念,一个项目可以有多个分支(版本),可以任意切换多人协作:Git支......
  • 统计分析 -- 聚类算法模型
    统计分析--聚类算法模型距离分析数据标准化欧氏距离与量纲有关,因此,有时需要对数据进行预处理,如标准化等。在MATLAB中的命令是zscore,调用格式Z=zscore(X)输入X表示N行p列的原始观测矩阵,行为个体,列为指标。输出Z为X的标准化矩阵:Z=(X–ones(N,1)*mean(X))./(ones(N,1)*......