给定一个基因表达矩阵和样本分组信息,如何绘制样品整体表达箱线图、单个或多个基因表达箱线图。
获取示例数据
我们从中截取前面4行作为演示例子。
利用工具Wide to Long把表达矩阵转换为长表格
把数据表粘贴到http://www.ehbio.com/Cloud_Platform/front/#/analysis?page=b%27OA%3D%3D%27的文本输入处,点击Check data
,确认数据无误,点击Submit
获得结果,下载下来,为文件bd3ebbe9-935d-4629-82bd-6d134c2aa386.WideToLong.txt。
文件内容如下:
利用工具Merge Matrixes合并表达信息和样本表
把上一步获得的长矩阵和最开始的sampleFile
粘贴到http://www.ehbio.com/Cloud_Platform/front/#/analysis?page=b%27NQ%3D%3D%27的2个文本域(顺序没有关系),点击Check data
,确认数据无误;
选择共有的列用于合并,如矩阵1的variable
列(这个名字是上一步默认生成的,可以修改)和矩阵2的Samp
列。图中标黄的为我们修改过的参数。
获得文件 40e4af19-206e-4f64-b21b-d0e78936fee1.matrix_combined.txt,文件内容如下:
绘制样本整体表达箱线图
把上一步获得的文件粘贴到箱线图绘制工具http://www.ehbio.com/Cloud_Platform/front/#/analysis?page=b%27MQ%3D%3D%27,点击Check data
,确认数据无误;
- 选择
variable
列,也就是样本名字列,作为X-axis variable
; - 选择
value
列, 也就是表达数据列,作为Y-axis variable
; - 选择
conditions
列,也就是样本分组信息列,作为Legend variable
,默认通过这一列上色作为图例。
点击Submit
,就可以获得绘制的图(png,pdf)格式和对应的代码。
除了看整体,连上单个基因查看下,增加一个参数Group variable for lining points
,设置为id
列,也就是基因名字列。
绘制单个/多个基因表达小提琴图
数据无需变动
- 选择
id
列,也就是基因名字列,作为X-axis variable
; - 选择
value
列, 也就是表达数据列,作为Y-axis variable
; - 选择
conditions
列,也就是样本分组信息列,作为Legend variable
,默认通过这一列上色作为图例。
在Layout and colors
面板下,设置:
- 设置
Plot type
为Violin plot
;
绘制单个基因表达小提琴图
数据无需变动
- 选择
id
列,也就是基因名字列,作为X-axis variable
; - 选择
value
列, 也就是表达数据列,作为Y-axis variable
; - 选择
conditions
列,也就是样本分组信息列,作为Legend variable
,默认通过这一列上色作为图例。
设置variable order
X-axis variable order
为ENSG00000109906
,默认带筛选功能,只选择这一个基因绘制;- 设置
Legend variable order
为untrt,trt
,对照在前,处理在后。
增加统计标记
通过预设的颜色集修改颜色
直接选择多个颜色进行上色
这两种修改颜色的方法是互斥的,一次只能用一种,一次也只能用一种。
绘制单个/多个基因表达小提琴图(分面)
数据无需变动
- 选择
conditions
列,也就是样本分组信息列,作为X-axis variable
; - 选择
value
列, 也就是表达数据列,作为Y-axis variable
; - 选择
conditions
列,也就是样本分组信息列,作为Legend variable
,默认通过这一列上色作为图例。
在Layout and colors
面板下,设置
- 设置
Plot type
为Violin plot
; - 设置
Facet variable
为id
列,也就是基因名字列,按基因名分面显示。