有的时候我们会发现,单因素cox回归某个基因对生存有意义,当以中位值绘制生存曲线的时候,却变得没意义了。
这是因为中位值并不是这个基因最合适的截断值,因此,我们需要选择最合适的截断值。
选择截断值的软件目前比较火比较方便的便是X-tile软件。
X-tile软件长这样:
点击 Analyze 即可开始分析。
可以看到,分析所需要的数据分为三种:Censor,Survival Time,Marker。
接下来准备输入数据:
数据需要三列,列名没有要求。Censor一列为生存状态,生存为0,死亡为1。Survival Time一列为生存时间,单位为日、周、月、年均可。Marker为我们要研究的变量,这里以基因表达量为例。
数据的格式为txt(文本文件,制表符分隔)。相关代码如下:
write.table(a, file = "1.txt", row.names = F, sep = "\t")
准备好数据之后,选择文件开始分析。
将左侧的各项Load到右侧。
然后依次点击如下图:
得到如下五张图:
最上面一张图是各种计算值。
中间左侧一张图有一个大的三角形和一个矩形,三角形横轴表示低表达人数逐渐增加,纵坐标表示高表达人数逐渐增加。点击三角形任意位置可将总人数分成差异最大的三组,点击矩形的任意位置可将总人数分成差异最大的两组。分组的截断值展示在中间的条形图中。其生存曲线在最右侧的图中。
点击三角形的结果如下:
点击矩形的结果如下:
把cut-off值记下来,然后用R语言做生存曲线。
对于生存数据寻找截断值,上述软件可快速找到最优截断值。
标签:截断值,生存,如下,点击,tile,三角形 From: https://www.cnblogs.com/xiaogaobugao/p/17115017.html