首页 > 其他分享 >dyMEAN数据集

dyMEAN数据集

时间:2024-08-10 12:07:11浏览次数:12  
标签:dyMEAN seq 轻链 PDB 序列 重链 数据 氨基酸

这条数据看起来是描述一个抗体-抗原复合物(来自PDB的6BKD结构)的详细信息,包括链的编号、序列、CDR区域等。以下是对每个字段的详细解释:

总体结构

  • pdb: "6bkd"

    • PDB ID,是一个四位字母代码,用于标识蛋白质数据库(PDB)中的一个特定的结构。这条数据描述的是PDB ID为 6bkd 的结构。
  • heavy_chain: "H"

    • 指定了抗体的重链在PDB文件中的链ID,这里是链 H
  • light_chain: "L"

    • 指定了抗体的轻链在PDB文件中的链ID,这里是链 L
  • antigen_chains: ["E"]

    • 列表形式,指定了抗原的链ID,在这个例子中,链 E 是抗原。
  • pdb_data_path: "/root/autodl-tmp/all_data/pdb/6bkd.pdb"

    • 本地PDB文件的路径,这个文件包含了指定结构(6BKD)的坐标数据。
  • numbering: "imgt"

    • 指定了序列编号系统,imgt 通常用于免疫学中的序列编号标准。
  • pre_numbered: true

    • 指示是否已经按照指定的编号系统进行过编号。true 表示数据已经按照 imgt 编号系统进行了编号。

序列信息

  • heavy_chain_seq:

    • 重链的氨基酸序列。这个序列对应于抗体重链的完整氨基酸序列。
  • light_chain_seq:

    • 轻链的氨基酸序列。这个序列对应于抗体轻链的完整氨基酸序列。
  • antigen_seqs:

    • 列表形式,包含抗原的氨基酸序列。在这个例子中,抗原序列是一个很长的字符串。

CDR 区域(互补决定区,Complementarity Determining Regions)

CDR区域是抗体中直接参与抗原结合的部分,通常分为三段,CDRH1、CDRH2、CDRH3 对应重链的CDR,CDRL1、CDRL2、CDRL3 对应轻链的CDR。

  • cdrh1_pos: [23, 30]

    • CDRH1的序列在重链序列中的位置。位置从第23到30个氨基酸。
  • cdrh1_seq: "GDTFRSYV"

    • CDRH1的具体氨基酸序列。
  • cdrh2_pos: [48, 55]

    • CDRH2的序列在重链序列中的位置。
  • cdrh2_seq: "IIPFFGTT"

    • CDRH2的具体氨基酸序列。
  • cdrh3_pos: [94, 117]

    • CDRH3的序列在重链序列中的位置。
  • cdrh3_seq: "AKAGDLSVGGVLAGGVPHLRHFDP"

    • CDRH3的具体氨基酸序列。CDRH3通常是最为多样化的一段序列。
  • cdrl1_pos: [24, 30]

    • CDRL1的序列在轻链序列中的位置。
  • cdrl1_seq: "QTVASNS"

    • CDRL1的具体氨基酸序列。
  • cdrl2_pos: [48, 50]

    • CDRL2的序列在轻链序列中的位置。
  • cdrl2_seq: "GAS"

    • CDRL2的具体氨基酸序列。
  • cdrl3_pos: [87, 92]

    • CDRL3的序列在轻链序列中的位置。
  • cdrl3_seq: "QQYGST"

    • CDRL3的具体氨基酸序列。

其他信息

  • cluster: "6bkd"
    • 可能是用于分类或标识数据的一个标签。在这个例子中,cluster 与 PDB ID 相同,但它可以根据上下文表示不同的分类或分组信息。

总结

这条数据主要描述了抗体-抗原复合物的详细信息,包括PDB文件路径、抗体的重链和轻链、抗原的链以及相关的序列和CDR(互补决定区)信息。这样的信息通常用于抗体研究、抗原结合研究以及相关的生物信息学分析。

标签:dyMEAN,seq,轻链,PDB,序列,重链,数据,氨基酸
From: https://www.cnblogs.com/csjywu01/p/18352141

相关文章

  • 大数据学习必备前置知识——Linux 之shell
    大数据学习必备前置知识——Linux之shell大家好!在为您带来精彩的技术干货之前,先给您推荐一个我精心运营的公众号[大数据深度洞察]。在这里,您将获取更多独家的技术分享、实用案例以及行业前沿资讯。亲爱的读者们,当您准备开启这篇充满价值的技术文章之旅时,不妨先关注我的公......
  • STM32 虚拟串口发不出数据
    在某个项目上,使用到了USB虚拟串口功能,芯片是STM32F105,在芯片刚复位时功能是正常,但是多发几次数据后,就发不出去了,一直返回USBD_BUSY,在下图中的344行返回USBD_BUSY解决办法是在这个函数内增加一些代码,等待数据发送完成之后再退出,或者超时退出,超时时间可以自己调整,根据自己的使......
  • MySQL——添加数据(一)为表中所有字段添加数据
            要想操作数据表中的数据,首先要保证数据表中存在数据。MySQL使用INSERT语句向数据表中添加数据,并且根据添加方式的不同分为三种,分别是为表的所有字段添加数据、为表的指定字段添加数据、同时添加多条记录。    通常情况下,向数据表中添加的新记录应该......
  • MySQL——添加数据(二)为表的指定字段添加数据
            为表的指定字段添加数据,就是在INSERT语句中只向部分字段中添加,而其他字段的值为表定义时的默认值。为表的指定字段添加数据的基本语法格式如下所示:INSERTINTO表名(字段1,字段2..)VALUES(值1,值2..)        在上述语法格式中,“字段1......
  • 在 SQL 中,怎样使用聚合函数(如 SUM、AVG、COUNT 等)来计算数据的总和、平均值和数量?
    在SQL中,可以使用聚合函数来计算数据的总和、平均值和数量。以下是一些常用的聚合函数的示例:SUM函数:计算指定列的总和。SELECTSUM(column_name)FROMtable_name;AVG函数:计算指定列的平均值。SELECTAVG(column_name)FROMtable_name;COUNT函数:计算指定列的数......
  • 黑群晖NAS挂载到服务器中,直接传输数据
    原文链接:一串代码将黑群晖挂载到服务器中,直接传输数据本期教程获得往期教程DataandCode,请在后台回复:20240810。请大家看清楚回复关键词,每天都有很多人回复错误关键词,我这边没时间和精力一一回复。2022年教程总汇2023年教程总汇写在前面我们在使用NAS的时候,......
  • 编写类 MyTools 类,编写一个方法可以打印二维数组的数据。 2) 编写一个方法 copyPerson
    1publicclassMethodExercise02{2publicstaticvoidmain(String[]args){34Personp=newPerson();5p.name="milan";6p.age=100;7//创建tools8MyToolstools=newMyTools();9......
  • 【数据结构】【模板】哈夫曼树
    哈夫曼树定义带权路径长度:结点的权值乘以结点到跟的距离。树上所有结点带权路径长度之和最小的二叉树称为哈夫曼树。性质哈夫曼是满二叉树。来自维基百科:原序列构成哈夫曼树的所有叶子结点。离根结点越近,点权越大。非叶子结点的点权之和就是所有叶子结点的带权路径之和......
  • 如何用sql在1分钟从1T数据中精准定位查询?Hive离线数仓 Spark分析
    最近在一个群里,从群友哪里了解到这样一个业务需求:如何在hdfs  1T源数据库中,1分钟内从其中抓取自己想要的数据?我的理解是:在hdfs数据库中为拥有 尽1T数据的表创建索引,并对其进行性能优化,以实现1分钟精准查询数据的目的  想要实现其实有点繁杂,可以使用多种工具和技......
  • 问题 E: 数据结构基础5-车厢调度
    题目描述有一个火车站,铁路如图所示,每辆火车从A驶入,再从B方向驶出,同时它的车厢可以重新组合。假设从A方向驶来的火车有n节(n<=1000),分别按照顺序编号为1,2,3,…,n。假定在进入车站前,每节车厢之间都不是连着的,并且它们可以自行移动到B处的铁轨上。另外假定车站C可以停放任意多节车厢。......