"Reads"(序列)是指从DNA测序技术中得到的短片段DNA序列。通常这些序列长度较短,可能只有几百个碱基对长。
"Contigs"(连读)是通过将读取序列拼接在一起来形成更长的序列。Contigs相对较长,可能达到数千个碱基对长,但它们可能仍然缺少一些重要的信息,例如重复序列或缺失区域。
"k-mers"(k个核苷酸长度的片段)是将读取序列分割成长度为k的小片段。它们可以用于重组读取序列以生成contigs或完整的基因组序列。
因此,这三个术语在基因组组装过程中扮演不同的角色,从原始数据的读取开始,到将其拼接成更长的序列,再到使用k-mers生成完整的基因组序列。
标签:contigs,碱基对,读取,Contigs,基因组,reads,mer,序列 From: https://www.cnblogs.com/wzbzk/p/17392246.html