- 2024-10-21零基础入门转录组下游分析——数据处理(TCGA数据库)
零基础入门转录组下游分析——数据处理(TCGA数据库)目录零基础入门转录组下游分析——数据处理(TCGA数据库)1.数据集获取2.数据处理(Rstudio)TCGA应该是肿瘤数据最权威的来源之一,但是从TCGA上下载数据集相对来说比较麻烦,因此出现了很多针对TCGA数据进行二次开发的衍生
- 2024-09-02学习笔记 — TCGA 差异表达分析及可视化
一、TCGA数据下载(LIHC为例)数据下载的方式和之前学习的临床数据的下载类似,先进入官网 https://portal.gdc.cancer.gov/新版TCGA数据库下载流程:CohortBuilder→Program(TCGA)、Project(LIHC)→点击Repository→侧边栏筛选:ExperimentalStrategy(RNA-Seq) →D
- 2024-07-23Python基础-Anaconda,Spyder,数据类型
1、Python与Anaconda在想使用Python之前需先安装Python,以及PythonIDE和Python的库,而用Anaconda就可以一键安装。Anaconda包含了Python,常用的python库以及IDE,还具有强大的环境和python包的管理能力。PythonIDE(IntegratedDevelopmentEnvironment,集成开发环境)是一个为开发
- 2024-05-26cBioPortal 数据库 API 使用
cBioPortal数据库API使用文章目录cBioPortal数据库API使用前言RPythoncBioPortalData1.数据结构2.API3.可视化3.1绘制K-M生存曲线3.2展示样本数最多的20种癌型3.3展示突变频率最高的20基因Python1.基本使用获取基因信息获取样本信息获取临床信息
- 2024-04-11TCGA+GTEx基因表达数据合并 | 多癌种表达分析
这个功能GEPIA2已经实现了,http://gepia2.cancer-pku.cn/#dataset但问题是它的数据不能导出,原图太丑,不能直接发表,那就没办法了,只能自己下载数据作图了。 TCGA数据可以批量下载GTEx数据也很容易下载但如何把TCGA的cancertype比对到GTEx特点组织,还是有点难度的。有些canc
- 2023-12-03免疫细胞浸润百分比堆积条形图-代码
免疫细胞浸润百分比堆积条形图该条形图展示的是每个TCGA的肿瘤样本中各个免疫细胞所占的比例。输入数据该输入数据的每一行显示的是一个TCGA的肿瘤样本中各个免疫细胞所占的比例。每一行的数据用制表符“\t”分隔。input.txt代码setwd("")#工作目录##读取文件,整理
- 2023-05-07R语言学习 - 非参数法生存分析
生存分析指根据试验或调查得到的数据对生物或人的生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度大小的方法,也称生存率分析或存活率分析。常用于肿瘤等疾病的标志物筛选、疗效及预后的考核。简单地说,比较两组或多组人群随着时间的延续,存活个体的比例变化
- 2023-02-23TCGA代码分析流程 - 3.3 生存模型:Lasso回归
LASSO回归什么是Lasso回归Tibshirani(1996) 引入了LASSO (LeastAbsoluteShrinkageandSelectionOperator)模型,用于参数的选择和收缩。当我们分析大数据时,这个模型
- 2023-02-09DNA甲基化芯片分析01: 使用methylumi和limma分析27K DNA甲基化芯片数据
前言27K的数据是很老的芯片数据,但是客户有需求就要找方法分析,主流的DNA甲基化芯片R包minfi和champ都只支持450K和850K的芯片。所以在bioconductor中搜索到了methylumi这
- 2023-02-02TCGA代码分析流程 - 3.2 生存分析
从分析的因素上看,有单因素分析和多因素分析。生存分析的常用的单因素分析(描述生存过程)方法有乘积极限法(Kaplan-Meier分析)和寿命表法(LifeTables),常用的多因素生存分析(
- 2023-02-01TCGA代码分析流程 - 3.1 生存分析前的数据整理
生存分析只需要tumor数据,不要normal,将其去掉,新表达矩阵数据命名为exprSet;clinical信息需要进一步整理,成为生存分析需要的格式,新临床信息数据命名为meta。由于不同癌症的临
- 2022-09-30TCGA代码分析流程 - 2.1 三大R包差异分析
0.准备判断式安装R包:如果该R包存在,可以顺带加载该R包,不需要再次library。if(!require(stringr))install.packages("stringr")if(!require(ggplotify))install.package
- 2022-09-27TCGA代码分析流程 - 0. 安装R包
1.设置镜像options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")options("repos"=c(CRAN="http://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
- 2022-09-27TCGA代码分析流程 - 1.1. 下载表达矩阵和临床信息数据
0. 在工作目录建立存储文件夹options(stringsAsFactors=F)library(stringr)cancer_type="TCGA-CHOL"if(!dir.exists("clinical"))dir.create("clinical")if(!dir.
- 2022-09-27TCGA代码分析流程 - 1.2. 整理表达矩阵和临床信息数据
1.整理表达矩阵下载的文件是按样本存放的,每个tsv文件中都记录着一个样本的基因表达量,需要将所有tsv文件合并,得到所有样本的基因表达量的表格。准备setwd("D:/R/CHOL")
- 2022-08-30TCGA数据库的挖掘工具
TCGA数据库的挖掘工具TCGA数据库的挖掘工具层出不穷,从数据下载到数据挖掘,这里marker整理一份官网的数据挖掘工具大全:http://www.cancerimagingarchive.net/TheCancer