比较新冠病毒与蝙蝠和穿山甲冠状病毒基因组/蛋白序列比对,更好地了解COVID-19病原体SARS-CoV-2的起源与进化
作者:王怡然 石育 赵月馨 沈讯
摘要:在新冠病毒COVID-19大流行的时代背景下,病毒的遗传信息对于其分类和可追溯性及其致病性至关重要。在全基因组水平上,SARS-CoV-2的序列同一性与蝙蝠和穿山甲的冠状病毒高度一致,这与SARS-CoV-2大流行的起源和演变有关,以明确的思路分析相关生物遗传信息,本实验针对新冠病毒COVID-19的1种病毒株蛋白遗传信息与蝙蝠和穿山甲冠状病毒蛋白组比对,通过对比并通过Pymol软件进行蛋白的可视化,通过这些来更好的了解新冠病毒的起源和进化。
关键词:新冠病毒 蝙蝠 穿山甲 可视化
一、前言
新冠肺炎疫情是百年来最严重的全球传染病大流行,也是最大的突发卫生事件。病毒溯源,旨在查找致病病毒的动物源头和向人类的传播途径,包括中间宿主的可能作用,这对采取有针对性的传染病防治措施、减少今后发生类似事件的风险具有至关重要的作用。拿出经得起历史检验的研究报告,首要原则是弘扬科学精神、秉持科学态度、遵循科学规律。
早在新冠疫情爆发之前,研究人员就已经从蝙蝠和穿山甲中发现冠状病毒,而伴随着新冠疫情的爆发,研究人员对冠状病毒有着更加深入的了解,以求发现新冠病毒的来源以及发现解决新冠疫情的药物。根据中科院上海生命科学信息中心对多篇新冠病毒相关论文进行综合分析,以及华南农业大学从穿山甲中分离出和新冠病毒相似度达99%的报道,总结出了新冠病毒来自于自然界这一结论。从以上结论中推断出新冠病毒可能是由于蝙蝠作为新冠病毒的自然宿主传播到中间宿主穿山甲身上,再通过穿山甲传播到人的身上,从而达到病毒的扩散。
通过对蝙蝠、穿山甲、人三种来源的冠状病毒进行序列对比分析,确定新冠病毒的来源,从而研制出更好的新冠病毒特效药。
二、序列比对介绍
序列比对是生物序列处理中的基本任务之一,比对的准确性影响后续分析。系统发育学、比较基因组学和蛋白质结构和功能预测都依赖于序列比对来寻找保守区域。序列比对软件通常在序列中的核苷酸或氨基酸残基之间插入间隙,以便可以比对尽可能多的相似位点。最后得到与序列数对应的列数和行数相同的字符矩阵。
序列比对的基本思想是,基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,检测序列之间的相似性,发现生物序列中的功能、结构和进化的信息。序列比对是将同源序列位点上匹配位点(相同或相似残基)与不匹配位点(不相似的残基)按照一定的记分规则转化成序列间相似性或差异性数值进行比较,相似值最大时的比对结果具有最多的匹配位点,从数学角度讲,应该是最优的比对结果。比对结果反映了数学模型或算法在多大程度上反映序列之间的相似性关系以及它们的生物学特征。
序列比对是生物信息学的基本组成和重要基础。生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出发,分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物分析序列进行分析,也就是研究新的计算机方法,从大量的序列信息中获取基因结构、功能和进化等知识。而在序列分析中,将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定,拼接,基因的表达分析,到RNA和蛋白质的结构功能预测。物种亲缘树的构建都需要进行生物分子序列的相似性比较。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义。
三、实验材料与方法
3.1实验材料与生物软件
3.1.1实验材料
NC_045512.2,MN996532.1,MT040336.1,NC_004718.3,MZ227558.1(SouthAfrica-B.1.351), MZ207859.1(UK-B.1.1.7),MW988204.1(Brazil-P.1),KC881005.1, MF593268.1, MG772933.1
3.1.2生物软件
NCBI数据库
RCSB蛋白质数据库(PDB)
BioEdit软件
MEGA软件
Pymol软件
3.2 实验方法
3.2.1 NCBI数据库检索SARS-CoV-2序列
为蛋白质区域长度和百分比保护设置阈值,以确定符合这些标准的候选序列。由于相关病毒株序列较短,故采用直接观察的方法进行查找。
3.2.2. BLAST搜索同源序列
使用NCBI附带的BLAST工具用于寻找蝙蝠、穿山甲中的相似序列。
3.2.3. SARS-CoV-2多序列比对
使用BioEdit软件进行SARS-CoV-2序列和蝙蝠、穿山甲序列的对比。
3.2.4进化树的构建
使用MEGA软件对所比对的蛋白进构建进化树,对不同地区的新冠病毒进化进行分析。
3.2.5新冠病毒与蝙蝠病毒的基因组变异分析
在NCBI BLAST中比对SARS-CoV-2和Bat RaTG13的序列号,得出identity和gap值,找到最大突变。
3.2.6蛋白质可视化处理
利用Pymol软件通过对选定的蛋白质进行除水、渲染等处理,得到更直观的蛋白质空间结构图,保存留作后续分析。
四、结果
4.1 SARS-CoV-2多序列比对
通过BioEdit软件分析得到保守比对蛋白质序列见图1。
图 1 新冠病毒序列比对
图 2病毒保守蛋白序列与蝙蝠、穿山甲蛋白组相似性比较结果
经查找在RCSB蛋白质数据库(PDB)中编号为6VXX,具体结果如图3所示。
图 3病毒保守蛋白序列与RCSB蛋白质数据库(PDB)比对结果
4.2 进化树的构建
图4 比对蛋白序列进化树
4.3 新冠病毒与蝙蝠病毒的基因组变异分析
图5 基因组变异对比
4.4 蛋白质可视化结果
Pymol软件处理结果如图6所示。
图6 蛋白质6VXX可视化结果
得到透视图和3D表面渲染图各一张,用于结构分析。
五、讨论
使用了SARS-CoV-2,BatCoV RaTG13和Pangolin-CoV的全长基因组序列作为参考序列,对其中常见基因组组织相似性进行比较。
RaTG13与Pangolin-CoV的序列同一性为96.1%,在整个基因组水平上,Pangolin-CoV与SARS-CoV-2的一致性为91.02%,Pangolin-CoV与SARS-CoV-2的亲缘关系仅次于RaTG13。但是Pangolin-CoV与SARS-CoV-2的S1功能基序高度一致,而RaTG13发生了四个突变,这说明Pangolin-CoV与SARS-CoV-2具有相似的宿主细胞识别能力。
将一种与新冠病毒的同源性高达96.2%的蝙蝠冠状病毒设定为新冠病毒在动物中的“祖先”,并以此为参考,把从“全球共享流感数据倡议组织”(GISAID)的数据库中提取的160个世界各地的新冠病毒基因,按照进化的关系,分为了A、B、C三个类型。其中,A型新冠病毒与蝙蝠身上的冠状病毒最为接近,被认定为是在人类身上传播的新冠病毒的“原始”类型。研究发现,A型毒株虽然出现在中国武汉,但在武汉样本中更多的是变异的B型毒株,A型毒株在美国和澳洲研究样本上更为常见。流传于欧洲的C型毒株则是由在中国和东亚扩散开来的B型变异而来。
在SARS-CoV-2棘突蛋白S1和S2亚基的连接处存在一个多基性裂解位点,即Furin蛋白酶裂解位点,并形成一种特殊的O-连接聚糖结构。此外,对SARS-CoV和SARS-CoV-2的比较研究表明,RBD中的6个氨基酸残基是与人ACE2结合的关键位点。目前,大多数功能性关键残基是通过直接相互作用,即通过探索蛋白质-蛋白质对接位点或酶-底物结合位点来鉴定的。通过序列比较确定可能与感染能力相关的位点,并确定人类和非人类冠状病毒之间的重要变异。这些位点的功能效应是通过蛋白质-蛋白质虚拟对接能量来评估。
人体对抗病毒的一个重要保护机制是能够产生针对该病毒的保护性抗体。当病毒的表面抗原蛋白间距为5-10纳米时,人体免疫系统能够发挥最佳反应。
一旦病毒真正进入细胞突破到人体组织里,我们的细胞就会发出各种信号,传递到免疫系统中。比如到人体血管中,血管中循环的免疫细胞会接受到信号,在信号诱导下,像个GPS一样告诉人体这个地方已经有病毒感染了,然后血液中、毛细血管中的免疫细胞,会沿着信号跑到有病毒的地方去,嗜中性、嗜酸性、嗜碱性细胞会通过受体跟病毒相结合,包括进细胞内,细胞内的溶酶体会慢慢降解掉病毒,把病毒的蛋白质降解掉,RNA降解掉,从而杀死一些病毒。
新冠病毒依然在全球蔓延,与此同时大量新冠病毒的基础研究也正在快速展开,在这个过程不同的研究从不同的角度着手,因而也会产生差异与分歧。通过将SARS-CoV-2与SARS、MERS、SARS样蝙蝠病毒等冠状病毒进行多序列比对,发现新冠病毒具有独特的furin蛋白酶切位点PRRA序列,这与流感病毒血凝素插入序列具有类似的特征,通过酶切预测、蛋白质对接揭示了furin蛋白酶切位点在新冠病毒感染中可能发挥重要作用。后续又有研究通过医学调查分析了furin蛋白酶切位点与新冠病毒的易感性关系,越来越多的研究支持furin蛋白酶决定了新冠病毒的高传播性。
参考文献:
1. Wrobel Antoni G,Benton Donald J,Xu Pengqi,Roustan Chloë,Martin Stephen R,Rosenthal Peter B,Skehel John J,Gamblin Steven J. SARS-CoV-2 and bat RaTG13 spike glycoprotein structures inform on virus evolution and furin-cleavage effects.[J]. Nature structural & molecular biology,2020,27(8).
2.Chao Jiannan,Tang Furong,Xu Lei. Developments in Algorithms for Sequence Alignment: A Review[J]. Biomolecules,2022,12(4).
3.Wrobel Antoni G.,Benton Donald J.,Xu Pengqi,Calder Lesley J.,Borg Annabel,Roustan Chloë,Martin Stephen R.,Rosenthal Peter B.,Skehel John J.,Gamblin Steven J.. Structure and binding properties of Pangolin-CoV spike glycoprotein inform the evolution of SARS-CoV-2[J]. Nature Communications,2021,12(1).
4. Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN,Weissig H, et al. The Protein Data Bank. Nucleic Acids Res.2000;28:235–42.
5. Shuai Xia,Qiaoshuai Lan,Shan Su,Xinling Wang,Wei Xu,Zezhong Liu,et al.The role of furin cleavage site in SARS-CoV-2 spike protein-mediated membrane fusion in the presence or absence of trypsin.Signal Transduction and Targeted Therapy.2020.
6.Kristian G. Andersen, Andrew Rambaut , W. Ian Lipkin,Edward C. Holmes 5 and Robert F. Garry.
The proximal origin of SARS-CoV-2.Nature Medicine.2020,26:450-455.
7.Tao Zhang,Qunfu Wu,Zhigang Zhang,et al.Probable Pangolin Origin of SARS-CoV-2 Associated with the COVID-19 Outbreak.Current Biology.2020,30:1346–1351.
分工:沈讯:前言,参考文献
石育:摘要,序列比对介绍
王怡然 赵月馨:实验材料与方法,结果,讨论
标签:冠状病毒,CoV,19,蝙蝠,新冠,序列,SARS,病毒 From: https://www.cnblogs.com/shenxun0904/p/17472782.html