20230316:转录组测序
-
转录组测序数据分析
最根本的是基础知识,不然给你数据你都不知道是干啥的.要多看综述,并且要多看几遍.-
下载GEO数据之前,需要先下载参考基因组数据.可以在三个平台上下载:ucsc,ncbi和ensemble,使用下面的检索式在搜索引擎中检索:
hg38 ftp ucsc就得到比如下面的网址:https://hgdownload.cse.ucsc.edu/goldenpath/hg38/bigZips/
以及下面的网站:https://useast.ensembl.org/info/data/ftp/index.html,及截图
选DNA就是去下载FASTA文件,要下载toplevel的那个.这些FASTA文件都有不一样,对于sequence type分类,有dna,dna_rm和dna_sm三种.如果是dna_rm,那么它的重复序列会被N来代替,如果是dns_sm,那么会使用小写字母来代替重复序列.dna的类型,那就是没有这些处理的.我们一般下载dna的就可以.
点GTF就是去下载基因注释文件,全称为gene transfer format,需要下载结尾带chr的.Regulation是去下载promoter和enhancer的数据.
因为做的是有参转录组,所以参考基因组和注释文件非常重要,需要明白去哪里找和怎么用.
-