蛋白互作网络图 - 网页工具string
输入数据:差异基因
输出:一个ppi图,可以导出数据
放入Cytoscape进行网络可视化
制作string的输入数据
load("step4output.Rdata") gene_up = deg[deg$change == 'up','symbol'] gene_down =deg[deg$change == 'down','symbol'] gene_diff = c(gene_up,gene_down) write.table(gene_up,file = "upgene.txt",row.names = F,col.names = F,quote = F) write.table(gene_down,file="downgene.txt",row.names = F,col.names = F,quote = F) write.table(gene_diff,file="diffgene.txt",row.names = F,col.names = F,quote = F)
保存上调、下调和所有差异基因,表中不显示行名、列名和引号
string分析
string网页工具: https://cn.string-db.org/ ,选择Multiple proteins;
输入数据:可以上调(upgene.txt)、下调(downgene.txt)基因分开做,也可以合并成差异基因(diffgene.txt)一起做
List Of Names:基因或蛋白名称,每行一个名称,可以直接从文件中复制过来
... or, upload a file:包含基因或蛋白名称的文件,txt和csv均可,这里直接用上述的txt文件
Organisms:选择物种,人类:Homo sapiens
然后点击SEARCH,出现检查基因界面(一般不需要检查)。
检查基因后点击右上角CONTINUE出图(protein-protein interaction,PPI图,蛋白互作网络图):
Exports输出tsv文件:“string_interactions.tsv”:
手动修改文件名为"string_interactionsup/down/diff.tsv",用啥基因分析的就修改成啥样的文件名,该文件名之后代码中会用到。
制作Cytoscape的输入数据
1. 网络文件
tsv = read.table("string_interactionsdiff.tsv",comment.char = "!",header = T) tsv2 = tsv[,c(1,2,ncol(tsv))] head(tsv2) write.table(tsv2,file = "cyto.txt",sep = "\t",quote = F,row.names = F)
1. 读取string分析的输出文件,第一行作为表头。需要修改文件名与string的输出文件一致(如果需要的话)。
2. 取tsv的前两列和最后一列。
3. 查看tsv2的前6行,前两列数据表示node1向node2的连线,combined_score列表示该连接的强弱。
4. 输出tsv2为txt文件,作为Cytoscape的网络文件。数据以制表符为分隔,不添加引号,不显示行名。
2. 属性文件
p = deg[deg$change != "stable",c("symbol","logFC","P.Value")] head(p) write.table(p,file = "deg.txt",sep = "\t",quote = F,row.names = F)
1. 从deg中取差异基因的“symbol”(基因名),“logFC”,“P.Value”列。
3. 输出p为txt文件,作为Cytoscape的属性文件。数据以制表符为分隔,不添加引号,不显示行名。
用Cytoscape软件美化PPI图
1. 导入网络文件和属性文件
左侧为导入网络文件“cyto.txt”,右侧为导入属性文件“deg.txt”:
导入网络文件时,设置node1为绿色“Source Node”(源节点),node2为红色“Target Node”(靶节点),表示从“Source Node”组指向“Target Node”组;
设置combined_score为“Edge Attribute”(边):
导入属性文件时,“Import Data as”默认为“Node Table Columns”,基因名“symbol”设置为“key”:
得到PPI图:
鼠标选中单个节点拖动,改变布局可以让中间的节点看着不拥挤。
2. 图片美化
选择参数区的Style,参数区Style介绍:
第一列Def.:全局属性更改。第二列Map.:将属性映射到某一列。第三列Byp.:更改选中节点的属性。
常用的节点参数:heighy+width(不锁定宽和高时),size(锁定宽和高时),fill color,border paint,border width,label font size,
常用的边参数:stroke color,width,
3. 插件
cytohHubba:寻找hub基因
Mcode:寻找子网络,寻找每个子网络的hub基因
3. 图片输出
一般为pdf格式
标签:文件,gene,string,流程,tsv,txt,GEO,Cytoscape,deg From: https://www.cnblogs.com/xiaogaobugao/p/16698472.html