基因组组装: 3D-DNA 染色体挂载

时间：2022-10-09 20:57:36浏览次数：85

导读

本文将介绍基因组组装过程中，如何利用HiC测序数据，进行染色体级别基因组的组装。该过程主要利用 Juicer 和 3D-DNA 进行，有关第一步Juicer的过程，已经下方的文章中介绍了，本文主要介绍第二步：3D-DNA的安装与使用。

1. 背景介绍

目前基因组组装的主要流程是，利用二代或者三代技术进行测序，利用得到的测序数据，拼接为contig级别的基因组，如果需要上升到染色体级别，那么就需要对物种进行HiC测序，进一步进行染色体挂载。目前对于二倍体动物，3D-DNA是效果最好的，下面就介绍3D-DNA的使用方法。

2. 安装

2.1. 流程图

3D-DNA流程图

上图是使用3D-DNA进行染色体挂载的流程图，其中第一步是测序和基础组装，测序一般是交给测序公司来完成，contig组装利用物种对应的组装软件即可。第二步时利用Juicer对HiC数据进行分析。第三步是利用3D-DNA进行挂载。

2.2. 依赖

下面这些是3D-DNA的依赖，如果阅读过之前Juicer的使用教程，那么环境已经配置完成，没有阅读过的读者，可以在文末选择跳转。

LastZ (version 1.03.73 released 20150708) –仅适用于二倍体
Java version >=1.7
Bash >=4
GNU Awk >=4.0.2
GNU coreutils sort >=8.11
Python >=2.7 - 仅适用于染色体编号感知分离器模块
scipy numpy matplotlib - 仅适用于染色体编号感知分离器模块

2.3. clone

# 从Github拉取仓库
git clone https://github.com/theaidenlab/3d-dna.git

3. 实战

3.1. 数据准备

基因组文件：genome.fa
Juicer结果：merged_nodups.txt

3.2. run

# 对组装的信心高，用-r 0, 否则用默认的-r 2就行了
# -r 代表 3d-dna 修正的次数
# merged_nodups.txt 在 上一步Juicer运行的aligned目录下
/home/ubuntu/3d-dna/run-asm-pipeline.sh -r 2 \
reference/genome.fa aligned/merged_nodups.txt &> log.txt &

3.3. 结果

最终的输出文件最关键的是下面三类:

.fasta: 以FINAL标记的是最终结果
.hic: 各个阶段都会有输出结果，用于在JABT中展示
.assembly: 各个阶段都会有输出，一共两列，存放contig的组装顺序

将结果中的.hic文件和.assembly文件导入Juicebox中进行调整，最后输出修改后的.assembly文件，再运行下面命令，即可获取染色体级别的基因组。

/home/ubuntu/3d-dna/run-asm-pipeline-post-review.sh \
-r genome.review.assembly \
genome.fa aligned/merged_nodups.txt

# genome.review.assembly 来自Juicebox中导出

读者有任何问题，可在评论区进行交流。

本文由mdnice多平台发布

标签：DNA,组装,测序,基因组,染色体,3D
From： https://www.cnblogs.com/swindler/p/16773637.html

3d线上虚拟展馆的优势及制作流程-深圳华锐视点
虚拟3D展馆是互联网时代最新的一种传播推广方式，协助企业完成数字化转型，打好“线上营销”这一仗就能收获更多的商机，成为线上展重点获客的选择。深圳华锐视点结合多......
招聘|瑞马智能招3D视觉算法工程师
公司介绍：江苏国华管塔制造有限公司，位于徐州经济开发区，地理位置优越，交通便利。公司注册资金1.02亿元，建筑面积约4.5万平方米，员工600多人。主要从事各类输电线路钢管杆、钢管塔......
ECCV20 3D目标检测新框架3D-CVF
前言这一篇文章主要介绍一篇发表在ECCV20上的采用多模态融合的3D目标检测的文章，并总结一下目前多多模态的方法。所谓多模态融合，即采取多种传感器数据作为深度学习网络的输入......
招聘 |华为云EI招聘3D视觉高级算法工程师
【部门介绍】华为云EI服务产品部：华为云EI是企业智能的使能者，基于AI和大数据技术，通过云服务的方式（公有云、专属云等模式），提供一个开放的、可信的、智能的平台，结合产业场景，使能......
最新3D目标检测文章汇总（包含ECCV20和ACMMM20）
前言3D目标检测在ECCV20的文章中呈现依旧火热的研究趋势，本文对目前笔者看到过的ECCV20和ACMMM20的3D目标检测文章做一个汇总，分类方法按照该方法是否在对应数据集上实验作为......
招聘|3D打印领军企业Helio Additive招机器学习算法工程师
公司介绍：HelioAdditive，是由国内3D打印材料行业领军企业Polymaker新建立的研发中心。岗位：软件工程师（机器学习）学历要求： 1.本科及以上学历，计算机科学，数学，统计学等相关专业；......
Unity3D 网页插件Embedded Browser(ZFBrowser)PC端打包文件无法加载网页解决方法
网页插件EmbeddedBrowser(ZFBrowser)PC端打包文件无法加载网页介绍：使用EmbeddedBrowser开发unity项目内嵌网页，打包后发现出现一个问题网页插件无响应，而在编辑器模式下场......
深圳华锐视点：企业3d虚拟云展厅让品牌得到三维立体、丰富、全面呈现
疫情对大部门实体企业运营的冲击是有目共睹的，深圳华锐视点积极运用web3d开发和VR虚拟现实制作等网络技术，作为解决参展商营销需求和满足参观者体验的手段，搭建3D云上虚拟......
Json字符串转换处理html编码格式，= \u003d 处理
Json字符串转换处理html编码格式，= \u003d处理importcom.alibaba.fastjson.annotation.JSONField;importcom.fasterxml.jackson.annotation.JsonAutoDetect;import......
html超浪漫的3D动态相册表白网站制作 html程序员专属情人节表白网站
......