王院长的报告涵盖了针对三代测序数据从碱基识别、基因组组装、变异检测和甲基化修饰检测等方面的内容。
在基因组组装算法方面,王院长分享了其团队在二代和三代测序数据基因组组装算法设计与分析方面的成果和突破。其中,针对长读长测序的高错误率以及错误分布不均匀等问题,王院长介绍了团队设计的一系列基因组组装和polish算法,展示了这些算法在多个物种的基因组组装、校正、二倍体组装等方面的应用和显著效果。同时,王院长介绍了目前正在进行结合甲基化和SNP等信息做进一步基因组单倍体分型的相关工作。
在基因组模式挖掘方面,王院长介绍了利用深度神经网络等方法,开发了纳米孔测序Base calling、长读长表观遗传修饰检测和低覆盖纳米孔SNP检测等一系列基因组模式挖掘算法。王院长着重介绍了DeepSignal和其植物版DeepSingal-plant、以及Ccsmeth在检测长读长数据DNA甲基化上的显著优势。