首页 > 其他分享 >上下游分析

上下游分析

时间:2023-12-05 15:11:41浏览次数:37  
标签:分析 上下游 seq RNA NGS bam 生信

上游分析

这里说的上游分析,通常指的是NGS组学数据的标准化流程,比如
  • WGS/WES的fastq—>bam—>vcf
  • RNA-seq的 fastq—>bam—>表达矩阵-差异基因
  • ChIP-seq等的fastq—>bam—>peaks(bed)—>motif(特征)
理论上完全练习实践掌握其中一个,是算作入门生信,可以通过自学获取另外一些NGS组学数据分析经验。 无非就是看几篇综述,看几篇实战教程,找几篇好的练习数据,参考一些公开代码,把流程走一遍,解决各种报错,理解各种中间数据及结果,模式各式各样的参数。不过这样的模式其实是非常耗费时间和精力,除非是做生信工程师的朋友我们才推荐自己慢慢踩坑,累积自己的经验。如果从利用NGS数据的角度来讲,跟着精彩的实操视频教程过一遍是最方便快捷的了,这里不得不推荐我们生信技能树团队出品的一系列实操视频:https://biotree.ke.qq.com/ 目前已有课程是芯片处理+转录组,近期会上线WES/WGS/ChIP-seq实操视频等等。 不过,大部分的临床大夫应该是都不需要这这个上游分析耗费太多精力,除非有特殊爱好,所以我们直接进入下游分析的主题。

下游分析

既然上面提到了大部分生物信息学上游分析对临床大夫来说很少需要完全掌握,那么你们的精力就应该是更加集中于下游数据解读上面了。可以是各种临床基因检测数据分析结果(SNV/CNV)的解读,也可以是各种疾病与正常对照的各种生命大分子(DNA/RNA/protein)表现(通常是表达量或者信号强度)的区别的解读。 并不需要关系那些SNV是如何来的,总之每个病人测序后的数据会经过业界比较权威的分析流程最后得到一些位点的突变与否信息。至于这个信息的准确与否不仅仅是取决于数据分析的流程,主要还是依赖于实验环节的设计。但是医生想利用好上游分析结果,就必须要掌握各种各样的遗传变异资源数据库,包括千人基因组,EXAC, gnomAD等等。尤其是需要批量注释的时候,前面所学的R语言以及在linux环境下的软件安装及使用,批量脚本的技能就都能派上用场。 也不需要关心各种疾病与正常对照的各种生命大分子(DNA/RNA/protein)表现值是如何得到的,不管是基因芯片(affymetrix公司或者illumina公司,或者agilent公司),还是NGS得到的,总之每个基因在每个样本都会有一个可供比较的值。下游分析需要更加侧重于细节的把控,比如常见的统计分析方法: 差异分析,富集分析,GSEA等等,样本如何根据其各自属性进行分组比较,样本聚类是否符合预期,表达量是否具有可比性,是否有显著的需要去除的偏差。而做这些细化的分析对R语言的要求其实还蛮高的,所以我才推荐大家把一本书看3年! 从用的角度来看,生信我能推荐的就这些了,其他的反倒是自己的本职工作,切莫舍本逐末!如果真心对生物信息学感兴趣,或者觉得人生很长,愿意花时间掌握一些技能,可以看我推荐给生信工程师的资源路线图:生物信息学入门需要具备什么能力?

标签:分析,上下游,seq,RNA,NGS,bam,生信
From: https://www.cnblogs.com/wangprince2017/p/17877322.html

相关文章

  • 毛利率分析之三
    一、接入或导入供应商数据,进一步进行成本分析二、建立供应商价格和主营成本对比模型二、建立供应商价格和主营成本对比看板从上图可以看出,供应商价格和主营成本趋势相同,并且供应商价格在主营成本中占比很高,合理降低供应商价格,是一个较大的利润增长点。如果企业所处的市场竞争非常激......
  • 【实战技能】 单步运行源码分析,一期视频整明白FreeRTOS内核源码框架和运行机制,RTOS Tr
    从源码的角度来看,OS内核源码就是通过各种链表组装起来的,FreeRTOS就是下面几个链表组成的。FreeRTOS的调度,任务切换就是倒腾这几个链表。而其它的几款OS是一个链表就一撸到底了,FreeRTOS是搞了好几个。所以视频里面就重点介绍下这个,其它的支持的也做个拓展说明。搞清楚这几个链表也......
  • 硬件开发笔记(十四):RK3568底板电路LVDS模块、MIPI模块电路分析、LVDS硬件接口、MIPI硬件
    前言  本篇继续分析底板原理图mipi/lvds屏幕电路原理图、硬件接口详解。 LVDS与MIPI的区别  液晶屏有RGBTTL、LVDS、MIPI、HDMI接口,这些接口区别于信号的类型(种类),也区别于信号内容。RGBTTL接口信号类型是TTL电平,信号的内容是RGB666或者RGB888还有行场同步和......
  • 使用Slurm集群进行分布式图计算:对Github网络影响力的系统分析
    本文分享自华为云社区《基于Slurm集群的分布式图计算应用实践:Github协作网络影响力分析》,作者:yd_263841138。1.引言Slurm(SimpleLinuxUtilityforResourceManagement)是一个针对小型Linux集群的开源、容错、高可扩展的集群管理及作业调度系统,它具备统一管理集群内的计算资源......
  • Unity DOTS系列之托管/非托管Component的区别与性能分析
    最近DOTS发布了正式的版本,我们来分享一下DOTS里面托管与非托管Component的区别与性能分析,方便大家上手学习掌握UnityDOTS开发。托管与非托管的区别在于是不是基于自动垃圾回收的。托管是由垃圾回收器来负责自动回收,非托管需要我们手动来做相关内存管理,不被垃圾回收系统来处理。......
  • Java 内存分析工具 Arthas 介绍与示例讲解
    目录一、概述二、Arthas安装三、Arthas主要组成结构四、Arthas通信主要流程五、Arthas快速入门讲解1)启动Arthas2)基础命令介绍3)jvm相关1、dashboard(实时数据面板)2、Thread(线程相关堆栈信息)3、jvm(查看当前JVM的信息)4、memory(查看JVM的内存信息)5、sysprop(查看/修改属性)6、s......
  • 一次elasticsearch 查询瞬间超时案例分析
    大家好,我是蓝胖子,有段时间没有做性能分析案例讲解了,正好前两天碰到一个性能问题,今天就来对它探讨探讨。问题背景在晚上9点左右,刚从外面逛街回到家,就接到了电话报警(幸好前不久刚好把电话报警机制加上,不然可能我就要去洗澡了......
  • 视频集中存储/智能分析融合云平台EasyCVR平台接入rtsp,突然断流是什么原因?
    安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快,可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等,以及支持厂家私有协议与SDK接入,包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安防视频监控的能力,也具备接入AI智能分析的......
  • 云电脑:IO虚拟化实现的技术分析
    本文分享自天翼云开发者社区《云电脑:IO虚拟化实现的技术分析》,作者:大利云电脑是一种基于云计算技术的虚拟化电脑,它通过网络将物理硬件资源虚拟化成多个虚拟机,每个虚拟机都拥有独立的操作系统和应用程序。IO虚拟化技术是实现云电脑的关键技术之一,它可以实现网络和存储等资源的虚拟......
  • R语言贝叶斯模型预测电影评分数据可视化分析
    本文使用R语言帮助客户进行了贝叶斯模型预测电影评分,并对数据进行了可视化和分析。文章创建了五个新的特征变量,包括电影类型、导演获奖情况、电影票房、评论数量和影评人数量等,并分析了这些变量对电影评分的影响。通过模型预测和系数解释,发现imdb_rating具有最高的后验概率,且截距......