这条数据看起来是描述一个抗体-抗原复合物(来自PDB的6BKD结构)的详细信息,包括链的编号、序列、CDR区域等。以下是对每个字段的详细解释:
总体结构
-
pdb
:"6bkd"
- PDB ID,是一个四位字母代码,用于标识蛋白质数据库(PDB)中的一个特定的结构。这条数据描述的是PDB ID为
6bkd
的结构。
- PDB ID,是一个四位字母代码,用于标识蛋白质数据库(PDB)中的一个特定的结构。这条数据描述的是PDB ID为
-
heavy_chain
:"H"
- 指定了抗体的重链在PDB文件中的链ID,这里是链
H
。
- 指定了抗体的重链在PDB文件中的链ID,这里是链
-
light_chain
:"L"
- 指定了抗体的轻链在PDB文件中的链ID,这里是链
L
。
- 指定了抗体的轻链在PDB文件中的链ID,这里是链
-
antigen_chains
:["E"]
- 列表形式,指定了抗原的链ID,在这个例子中,链
E
是抗原。
- 列表形式,指定了抗原的链ID,在这个例子中,链
-
pdb_data_path
:"/root/autodl-tmp/all_data/pdb/6bkd.pdb"
- 本地PDB文件的路径,这个文件包含了指定结构(6BKD)的坐标数据。
-
numbering
:"imgt"
- 指定了序列编号系统,
imgt
通常用于免疫学中的序列编号标准。
- 指定了序列编号系统,
-
pre_numbered
:true
- 指示是否已经按照指定的编号系统进行过编号。
true
表示数据已经按照imgt
编号系统进行了编号。
- 指示是否已经按照指定的编号系统进行过编号。
序列信息
-
heavy_chain_seq
:- 重链的氨基酸序列。这个序列对应于抗体重链的完整氨基酸序列。
-
light_chain_seq
:- 轻链的氨基酸序列。这个序列对应于抗体轻链的完整氨基酸序列。
-
antigen_seqs
:- 列表形式,包含抗原的氨基酸序列。在这个例子中,抗原序列是一个很长的字符串。
CDR 区域(互补决定区,Complementarity Determining Regions)
CDR区域是抗体中直接参与抗原结合的部分,通常分为三段,CDRH1、CDRH2、CDRH3 对应重链的CDR,CDRL1、CDRL2、CDRL3 对应轻链的CDR。
-
cdrh1_pos
:[23, 30]
- CDRH1的序列在重链序列中的位置。位置从第23到30个氨基酸。
-
cdrh1_seq
:"GDTFRSYV"
- CDRH1的具体氨基酸序列。
-
cdrh2_pos
:[48, 55]
- CDRH2的序列在重链序列中的位置。
-
cdrh2_seq
:"IIPFFGTT"
- CDRH2的具体氨基酸序列。
-
cdrh3_pos
:[94, 117]
- CDRH3的序列在重链序列中的位置。
-
cdrh3_seq
:"AKAGDLSVGGVLAGGVPHLRHFDP"
- CDRH3的具体氨基酸序列。CDRH3通常是最为多样化的一段序列。
-
cdrl1_pos
:[24, 30]
- CDRL1的序列在轻链序列中的位置。
-
cdrl1_seq
:"QTVASNS"
- CDRL1的具体氨基酸序列。
-
cdrl2_pos
:[48, 50]
- CDRL2的序列在轻链序列中的位置。
-
cdrl2_seq
:"GAS"
- CDRL2的具体氨基酸序列。
-
cdrl3_pos
:[87, 92]
- CDRL3的序列在轻链序列中的位置。
-
cdrl3_seq
:"QQYGST"
- CDRL3的具体氨基酸序列。
其他信息
cluster
:"6bkd"
- 可能是用于分类或标识数据的一个标签。在这个例子中,
cluster
与 PDB ID 相同,但它可以根据上下文表示不同的分类或分组信息。
- 可能是用于分类或标识数据的一个标签。在这个例子中,
总结
这条数据主要描述了抗体-抗原复合物的详细信息,包括PDB文件路径、抗体的重链和轻链、抗原的链以及相关的序列和CDR(互补决定区)信息。这样的信息通常用于抗体研究、抗原结合研究以及相关的生物信息学分析。
标签:dyMEAN,seq,轻链,PDB,序列,重链,数据,氨基酸 From: https://www.cnblogs.com/csjywu01/p/18352141