首页 > 其他分享 >ChIP-seq 分析:Differential Peaks(15)

ChIP-seq 分析:Differential Peaks(15)

时间:2023-03-22 23:00:35浏览次数:68  
标签:15 Peaks DESeq2 参数 seq 我们 冗余 函数

动动发财的小手,点个赞吧!

1. 寻找差异区域

然而,识别特定于细胞系或条件的峰并不能捕获表观遗传事件的全部变化。

为了识别表观遗传事件的差异,我们可以尝试量化 IP 样本中非冗余峰组中片段丰度的变化。

我们首先必须建立一组区域,在这些区域中量化 IP ed 片段。

一种成熟的技术是产生一组非冗余峰,这些峰出现在至少一个被评估的实验条件的大多数中。

在这里,我们确定了在 Mel 或 Ch12 细胞系的两个重复中出现的峰。

HC_Peaks <- allPeaksSet_nR[rowSums(as.data.frame(mcols(allPeaksSet_nR)[, c("ch12_1",
    "ch12_2")])) >= 2 | rowSums(as.data.frame(mcols(allPeaksSet_nR)[, c("Mel_1",
    "Mel_2")])) >= 2]
HC_Peaks

HC_Peaks

export.bed(HC_Peaks, "HC_Peaks.bed")

HC_Peaks

2. 计数区域

我们将从对齐的 BAM 文件中计数以量化 IP 片段。

正如我们之前所见,我们可以使用 BamFileList() 函数来指定要计数的 BAM,重要的是,为了控制内存,我们使用 yield() 参数指定一次要保存在内存中的读取次数。

library(Rsamtools)

bams <- c("~/Projects/Results/chipseq/testRun/BAMs/Sorted_Myc_Ch12_1.bam", "~/Projects/Results/chipseq/testRun/BAMs/Sorted_Myc_Ch12_2.bam",
    "~/Projects/Results/chipseq/testRun/BAMs/Sorted_Myc_Mel_1.bam", "~/Projects/Results/chipseq/testRun/BAMs/Sorted_Myc_Mel_2.bam")
bamFL <- BamFileList(bams, yieldSize = 5e+06)
bamFL

我们可以使用 summarizeOverlaps 函数计算与峰重叠的片段数。由于 ChIPseq 是无链的,我们将 ignore.strand 参数设置为 TRUE。

返回的对象是一个熟悉的 RangedSummarizedExperiment,其中包含我们的非冗余峰的 GRanges 以及我们 BAM 文件在这些区域中的计数。

library(GenomicAlignments)
myMycCounts <- summarizeOverlaps(HC_Peaks, reads = bamFL, ignore.strand = TRUE)
class(myMycCounts)
save(myMycCounts, file = "data/MycCounts.RData")

myMycCounts

3. DESeq2

为了评估跨细胞系的 ChIPseq 信号变化,我们将使用 DESeq2 包。

DESeq2 包包含一个工作流程,用于评估复制条件之间片段/读取丰度的局部变化。此工作流程包括标准化、方差估计、离群值移除/替换以及适用于高通量测序数据(即整数计数)的显着性测试。

要使用 DESeq2 工作流程,我们必须首先创建一个感兴趣条件的 data.frame,并将行名设置为我们的 BAM 文件名。

metaDataFrame <- data.frame(CellLine = c("Ch12", "Ch12", "Mel", "Mel"))
rownames(metaDataFrame) <- colnames(myMycCounts)
metaDataFrame

metaDataFrame

我们可以使用 DESeqDataSetFromMatrix() 函数来创建 DESeq2 对象。

我们必须将我们的计数矩阵提供给 countData 参数,我们的元数据 data.frame 提供给 colData 参数,并且我们在 rowRanges 的可选参数中包含我们可以依靠的非冗余峰值集。

最后,我们在我们希望测试设计参数的元数据 data.frame 中提供列的名称。

library(DESeq2)
deseqMyc <- DESeqDataSetFromMatrix(countData = assay(myMycCounts), colData = metaDataFrame,
    design = ~CellLine, rowRanges = HC_Peaks)

我们现在可以使用 DESeq() 函数在我们的 DESeq2 对象上运行 DESeq2 工作流程。

deseqMyc <- DESeq(deseqMyc)

deseqMyc

我们的 DESeq2 对象已更新,以包含有用的统计信息,例如我们的标准化值和每个非冗余峰调用中的信号方差。

deseqMyc

deseqMyc

我们可以使用 results() 函数提取差异区域的信息。

我们向 results() 函数提供 DESeq2 对象、对对比参数感兴趣的比较以及返回格式参数的输出类型。

与对比参数的比较作为长度为 3 的向量提供,包括感兴趣的元数据列和要测试的组。

我们可以使用 order() 函数按 pvalue 对结果进行排序,以按最显着的变化进行排名。

MelMinusCh12 <- results(deseqMyc, contrast = c("CellLine", "Mel", "Ch12"), format = "GRanges")
MelMinusCh12 <- MelMinusCh12[order(MelMinusCh12$pvalue), ]
class(MelMinusCh12)

MelMinusCh12

GRanges 对象包含有关在 DESeq2 中进行的比较的信息。

最有用的是它包含 IP 信号的差异,如 log2FoldChange 中的 log2 倍变化、pvalue 列中变化的重要性以及调整后的 p 值以解决 padj 列中的多重校正。

MelMinusCh12[1, ]

MelMinusCh12

我们现在可以通过过滤 log2FoldChange 和 padj(针对多重校正调整的 p 值)小于 0.05,将我们的非冗余峰过滤为 Mel 或 Ch12 细胞系中信号明显更多的峰。

MelMinusCh12Filt <- MelMinusCh12[!is.na(MelMinusCh12$pvalue) | !is.na(MelMinusCh12$padj)]
UpinMel <- MelMinusCh12[MelMinusCh12$padj < 0.05 & MelMinusCh12$log2FoldChange >
    0]
DowninMel <- MelMinusCh12[MelMinusCh12$padj < 0.05 & MelMinusCh12$log2FoldChange <
    0]
export.bed(UpinMel, "UpinMel.bed")
export.bed(DowninMel, "DowninMel.bed")

DowninMel

最后,我们可以使用 tracktables 包让我们在 IGV 中审查站点更容易一些。

tracktables 包的 makebedtable() 函数接受一个 GRanges 对象并编写一个包含 IGV 链接的 HTML 报告。

library(tracktables)
myReport <- makebedtable(MelMinusCh12Filt, "MelMinusCh12.html", basedirectory = getwd())

browseURL(myReport)

本文由mdnice多平台发布

标签:15,Peaks,DESeq2,参数,seq,我们,冗余,函数
From: https://www.cnblogs.com/swindler/p/17245821.html

相关文章

  • 洛谷P1115 最大子段和
    题目传送门题目描述给出一个长度为 n 的序列 a,选出其中连续且非空的一段使得这段和最大。输入格式第一行是一个整数,表示序列的长度 n。第二行有 n 个整数,第......
  • 15.阵列(圆周阵列、曲线驱动的阵列)
    一、圆周阵列1.圆周阵列2.在基准面上绘制草图3.选择筋命令选择直线(直线选择两侧端点则筋不成功),回车4.选择圆周阵列 二.曲线驱动的阵列1.转换曲线 2.等距曲......
  • 001-ksum 求符合条件的 k 个数 1. Two Sum/15. 3Sum/18. 4Sum/
    推荐阅读000-从零开始的数据结构与算法001-01-ksum求符合条件的k个数1.TwoSum/15.3Sum/18.4Sum/002-两数相加addtwonumbers003-无重复字符的最长子串Longe......
  • 100道python基础题——(1-15总结)
    1.lisi操作①列表更新list[index]②增加元素list.append(element):append是加一个列表的值,列表可以加数字,字符串,列表,元组等list.extend(element):extend是解析一个列......
  • LeetCode15. 三数之和
    题目描述:给你一个整数数组nums,判断是否存在三元组[nums[i],nums[j],nums[k]]满足i!=j、i!=k且j!=k,同时还满足nums[i]+nums[j]+nums[k]==0。请你......
  • 523-(ZCU102E的pin兼容替代卡) 基于 XCZU15EG的双 FMC通用信号处理板 高速信号处理、车
    (ZCU102E的pin兼容替代卡)基于XCZU15EG的双FMC通用信号处理板一、板卡概述   本板卡基于XilinxZynqUltrascale+MPSOC系列SOCXCZU15EG-FFVB1156......
  • 100道python基础题——(15)
    题:编写一个程序,计算a+aa+aaa+aaaa的值,给定的数字作为a的值。假设为程序提供了以下输入:9  然后,输出应该是:11106提示:如果输入数据被提供给问题,则应该假定它是控......
  • HTML15新增元素
    HTML5新增元素概述HTML5新增的主要结构元素有6个:header、nav、article、aside、section、footer。header在HTML5中,header元素一般用于3个地方:页面头部:如网站名称、......
  • 1541. 平衡括号字符串的最少插入次数
    给你一个括号字符串 s ,它只包含字符 '('和 ')' 。一个括号字符串被称为平衡的当它满足:任何左括号 '(' 必须对应两个连续的右括号 '))' 。左括号 '(' 必须在......
  • 15_SpringBoot_模板引擎总结_了解
    jsp优点:1、功能强大,可以写java代码2、支持jsp标签(jsptag)3、支持表达式语言(el)4、官方标准,用户群广,丰富的第三方jsp标签库缺点:性能问题。不支持前后端分离freemarker......