1. 问题
1.1 多序列比对
一开始很难理解为什么3条序列的时间复杂度就是\(O(L^3)\)(\(L\)为序列长度).这里看下面这张图就明白必须要3条链一起对比,而不是两两对比就知道全部信息.主要是要找到全部序列的相似特点.
多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个简明扼要的了解。与双序列比对一样,多序列比对的方法建立在某个数学或生物学模型之上.
具体可以看这个博客Click.
1.2 为什么可以任意插入gaps
目前是我的猜测,因为基因序列在演化过程中会出现突变、插入和丢失的现象.假设有这种现象存在,因此在序列比对时,考虑插入gaps以获得更多的分数.但是也不能任意插入gaps,因此引入空位罚分的机制.参考下这篇ppt.
标签:一组,基因,问题,插入,gaps,序列,生信 From: https://www.cnblogs.com/newblg/p/17730967.html