一、CHIP-qPCR作用
CHIP-qPCR(染色质免疫共沉淀结合定量聚合酶链反应)是一种用于研究蛋白质与DNA相互作用的技术。它结合了染色质免疫共沉淀(ChIP)和定量聚合酶链反应(qPCR)两种方法,具有以下几个主要作用:
-
分析蛋白质与DNA的相互作用:CHIP-qPCR可以用来检测特定蛋白质(如转录因子或组蛋白修饰)在基因组中的特定位点的结合情况。
-
验证ChIP-seq结果:在完成ChIP-seq分析后,研究人员通常会找到感兴趣的转录因子或组蛋白修饰的靶基因,CHIP-qPCR可以用来进一步证实这些结合状态。
-
定量分析:与全基因组测序方法相比,CHIP-qPCR更便宜、更省时,可以对多种样品中的特定基因组区域进行快速和定量比较。
二、基于测序数据的CHIP-qPCR
如果前期已经进行ATAC-seq、CHIP-seq、cut&tag-seq 或/和 cut&run-seq等检测分析,并拥有一些感兴趣的潜在靶基因,且这些基因上鉴定到peak的存在,可以使用IGV软件分别对这些peak在染色体上进行可视化。具体流程如下:
- 寻找目的基因上的peak 无论是自己进行测序分析,还是找生物平台进行测序分析,最终都会有如上图所示的peak鉴定与注释结果表格,根据需要筛选出基因和其上peak即可。
简单介绍一下表格中每列内容:
A列:是peak所在染色体编号;
B和C列:是该peak在具体染色体上的位置;
D列:是peak的长度;E和F列是进行peak鉴定的一个关键参数:p和q值取-log10,一般要求p<0.05,严格的话使用q<0.05;
G列:是进行peak鉴定的另一个关键参数:可以简单理解为IP:Input的富集倍数(实际没那么简单);
H列:是该peak位于基因上功能元件的位置;
I列:是peak所在基因的Ensembl_ID;
其他列:基因的名称和位置信息等。
注:请根据您实际的表格信息查看,A-I列内容是肯定会有的,可能命名不同而已! - peak可视化文件准备 简单粗暴,要么是bw格式,要么是tdf格式。一般一个样本会有IP和Input两个文件,而ATAC-seq等只有一个bw/tdf格式文件,因为这个技术用的Tn5酶切。
- 参考基因组获取
进行上述测序,那可定是有对应的参考基因组序列文件(.fna格式)和注释文件(.gff/.gtf/.gff3格式),准备好这两个文件,如果是找生物工作的分析,让公司提供他们进行参考基因组建库用的这两个文件。
有小伙伴就要问了,我直接下不行吗?不建议。因为不知道生物公司构建的参考基因组文库有没有调整过内容。如果调整过:使用自己的参考基因组用IGV加载后,peak可视化用的.bw/.tdf等文件无法识别出来,或者识别不完整等。 - IGV软件下载
IGV软件官网下载地址(免费软件):IGV: Integrative Genomics Viewer
建议使用2.10.0版本,别问为啥,截至目前新版本的IGV加载参考基因组和注释文件需要分开加载,虽然减少了内存资源占比,但时间翻倍(新版本适用于参考基因组文件小的物种,或者电脑运行内存小于16GB的小伙伴)。下载安装包后,直接安装就行,没啥需要特别配置的。 - peak可视化第一次打开IGV软件是如上图所示的一个初始页面。
折腾那么久,此处开始让你看见心心念念的peak是个啥样的:
简单介绍一下界面都是些啥
加载测序得到的.bw/.tdf文件,并进行调整处理:
打开后是下图这样滴:
然后根据进行调整,此处用的CHIP-seq数据,采用IP-Input可视化,注:这里如果是ATAC-seq数据没有这一步;如果小伙伴想看RNA甲基化(IP方法检测的)数据,请采用IP/Input。当然了,也可以将两者调整显示值范围调整一致,然后不对IP和Input进行计算处理,或者将两个重叠映射在一起进行展示。
- 无论哪一种方法,请养成习惯,第一步先把显示峰值范围调成一致,并把注释文件展开(有的基因存在剪切变体,或者基因间有重合的地方,需要展开):
- 方式——IP-Input:
因为每次只能处理一个样本,所以多样本采取相同的步骤进行处理就好了,最后得到下面这样的:
有了IP-Input的文件,就可以将IP和Input文件移除了,然后调整每个样本界面(Track)的高度:
移除后结果是这样的 :
然后调整 每个样本界面(Track)的高度:
弹出框中输入合适数值(自己多调整哈,毕竟样本越多,这里数值就越小才行),这里两个样本的话,可以填一个200,然后点击确定:
结果这样滴:
展示(差异/peak表中得到的)目标基因,我随机输一个基因了哈:
结果这样滴:
标记peak所在位置:打开你的peak鉴定表或者差异peak表,这里我随机弄一个位置哈(如Chr:90067835-90068315),然后跟我一起点点点 :
结果如下,peak就是绿色框框的区域(为了方便看,手动截图标记的),对应红色块 :
如果想要调整不同样本展示为不同颜色,跟我继续点点点:
我就选择一个丑丑的红色了,结果如下:
多提一句,可以通过以下不揍调整展示基因界面宽度:
言归正传,找到peak区域,下一步将peak这一段区域复制出来,然后放到word文档里面中:
如果peak很短(小于400 bp),我们可以在上面的基础上,进行以下点点点:
得到这个序列后,使用引物设计软件进行CHIP-qPCR引物设计,设计要求:
1.扩展区域:在peak区域内或包含peak区域;
2.产物长度:100-200 bp,最佳150 bp;
3.GC%/引物长度等要求同qPCR。
Ok了,到这里引物就设计完了。
再多提一句:这里用的IP-Input作图,如果其他方法的话,操作也是一样的,一通则百通哈。
三、基于前人研究/拥有目标基因
如果有目标基因或者前人在同一物种中研究过,而你不想做测序(因为贵,而且结果还不一定理想,毕竟CHIP实验不可控因素太多),当然,有经费还是做一下的好,毕竟现在是“大数据”时代。
第一种情况-拥有目标基因:拥有目标基因,没人研究/不在本物种/不在近缘物种中研究过, 可以去UCSC或者Jaspar等网站搜索看看,研究的组蛋白/转录结合因子结合基序和位置什么什么样,然后参考这个基序和结果,在你的基因多个区域设计CHIP-qPCR引物,然后筛选有显著富集的区域即可。
四、CHIP实验过程
此处不赘述,不同样本类型处理不一样。只需要记住IP和Input的实验用量比例即可,后续计算需要用到。此处以IP:Input=10:1为例,即稀释因子矫正参数DF=log2(10:1)。
五、结果计算
看你做不做IgG,因此有两种富集度计算方法:
- % (ChIP/ Total input)= 2^[(Ct(input) - DF) - Ct(ChIP)]x 100%;
- % (IgG-IP/ Total input)= 2^[(Ct(input) - DF - Ct(IgG-IP)]x 100%
然后根据计算结果,进行显著性分析(p<0.05,具有统计学意义就行,至于富集倍数相差多少,这个跟结合程度有关),绘制柱状图即可。
又多说一句:MeRIP-qPCR的计算也是这样的哦!!!!
创作不易,仅供学习交流使用,未经允许禁止转载,谢谢!!!
标签:qPCR,IP,CHIP,基因,引物,peak,Input From: https://blog.csdn.net/weixin_62054183/article/details/144769200