首页 > 其他分享 >[论文精读][基于点云的蛋白-配体亲和力]A Point Cloud-Based Deep Learning Strategy for Protein-Ligand Binding Affinity

[论文精读][基于点云的蛋白-配体亲和力]A Point Cloud-Based Deep Learning Strategy for Protein-Ligand Binding Affinity

时间:2023-10-13 10:57:08浏览次数:39  
标签:1024 精读 Based 亲和力 Prediction 原子 配体 点云 蛋白

我需要的信息

  • 代码论文

  • 不考虑共价键,每个点包括了六种原子信息,包括xyz坐标,范德华半径,原子重量以及来源(1是蛋白质,-1是配体)。原子坐标被标准化,其它参数也被标准化。对不足1024个原子的的复合体,补0到1024。

  • 增加考虑的原子从1024到2048,没有提升,增加原子信息通道,没有提升(见result)

Abstract

  • 基于AI的蛋白质-配体亲和力模型可用于药物发现
  • 本文首次使用PointNet和PointTransformer来做亲和力
  • 有效学习,而且PointTransformer学习到的蛋白配体互作用特征可以适用于XGBoost,在预测任务上和sota水平相当。
  • 结果表明三维点云算法可以有效学习到PDBbind数据集里的自然进化和化学机制等知识

Introduction

以前的方法

  • 分子表述:FPRC, PerSpect, PSH
  • 2D互作用图:DeepBindRG
  • 3D体素:KDeep, AK-Score, DeepAtom
  • 图数据:Graph-CNN, GraphBAR

点云方法

  • 猜想点云方法可以比体素方法更快更简单。
  • 点云中的每个点代表蛋白质配体结构中的一个现有原子,这一显著特征将有助于通过可视化来解释已开发的模型
  • 两种模型的Pearson correlation coefficient都测试了
  • 把输入后的特征给到XGBoost,预测结果和sota的机器学习方法相当。

Methods

Dataset

  • 使用精细化过的PDBbind-2016,包括4057个蛋白-配体复合物数据。3772个数据是训练集和验证集,其他的core set是测试集。
  • 还使用了general的PDBbind-2016,含有肽复合物的被删去,复合物不足的被删去,测试集删去。得到11 327的训练集。
  • 以配体为中心,选取最近的1024个蛋白原子。
  • 不考虑共价键,每个点包括了六种原子信息,包括xyz坐标,范德华半径,原子重量以及来源(1是蛋白质,-1是配体)。原子坐标被标准化,其它参数也被标准化。对不足1024个原子的的复合体,补0到1024。
  • 为调查输入,还做了两个实验:增加原子种类的channels,原子采样从1024增加到2048

Comparison of pre-processing and inference time of different models

使用c++加速点云的生成还和体素的方法进行了时间的比对

PointNet and PointTransformer architecture and training

  • 网络框架大概长这样,然后强调了,原子输入顺序不影响结果因为有我们的Max Pool。这个在pointnet++里也是一样的。

  • 训练的时候把点云翻转了24次,相当于数据集增加了24倍。测试的时候把输入翻转24次,取预测的平均值。

Result

其它result笔者不感兴趣,略

标签:1024,精读,Based,亲和力,Prediction,原子,配体,点云,蛋白
From: https://www.cnblogs.com/sherrlock/p/17761564.html

相关文章

  • Fi-GNN: Modeling Feature Interactions via Graph Neural Networks for CTR Predicti
    目录概Fi-GNN代码LiZ.,CuiZ.,WuS.,ZhangX.andWangL.Fi-GNN:Modelingfeatureinteractionsviagraphneuralnetworksforctrprediction.CIKM,2019.概"图网络"用在精排阶段(算哪门子图网络啊).Fi-GNN一个item可能有多种field,比如:\[\underbrace......
  • C++11新特性之基本范围的For循环(range-based-for)
    C++11新特性之基本范围的For循环(range-based-for)最新推荐文章于 2023-07-2219:30:58 发布Rayen0715于2017-01-0713:49:35发布49588收藏174版权Range-Based-For熟悉C++98/......
  • 2023ICCV_Retinexformer: One-stage Retinex-based Transformer for Low-light Image
    一.Motivation(1)Retinex理论没有考虑到噪声,并且基于Retinex分解的网络通常需要很多阶段训练。(2)直接使用从CNN从低光图像到正常光图像的映射忽略了人类的颜色感知,CNN更适合捕获局部信息,对于捕获远程依赖和非局部自相似性方面存在局限。二.Contribution(1)设计了一个阶段......
  • Attribute Based Group Signature with Revocation
    AttributeBasedGroupSignatureswerefirstintroducedin[12].Itwasproposedtoservethepurposeofincludingattributesinagroupsignaturescheme.GroupSignaturesallowamemberofagrouptosignonbehalfoftheotherswhileinABGSschemesthe......
  • Codeforces Round 707 (Div. 2, based on Moscow Open Olympiad in Informatics) B. N
    按以下\(n\)次操作制作蛋糕。叠上第\(i\)块面包,然后浇上\(a_i\)单位的奶油。可以使当前往下\(a_i\)块面包沾上奶油。输出空格隔开的\(n\)个数,第\(i\)个的\(0/1\)代表第\(i\)块面包是否沾有奶油。比较显然的思路可以进行差分修改。view1#include<bits/std......
  • Codeforces Round 902 (Div. 2, based on COMPFEST 15 - Final Round)
    目录写在前面ABCDE写在最后写在前面比赛地址:https://codeforces.com/contest/1877。呜呜铃果唱歌太好听了、、、我宣布是第二喜欢的声线,第三喜欢是东北切蒲英,第一喜欢绝赞招募中。这下不得不成为数码推了、、、A答案为\(-\suma_i\)。懒得写代数式子推了,赛时看完题直接......
  • (2023年新疆大学、中科院等点云分类最新综述) Deep learning-based 3D point cloud cl
    目录1、引言2、3D数据2.1、3D数据表示形式2.2、点云数据存储格式2.3、3D点云公共数据集3、基于深度学习的点云分类方法3.1、基于多视角的方法3.2、基于体素的方法3.3、基于点云的方法3.3.1局部特征聚合3.3.1.1基于逐点处理的方法3.3.1.2基于卷积的方法3.3.1.3基于图的方法3.3.1......
  • Codeforces Round 902 (Div. 2, based on COMPFEST 15 - Final Round)
    Preface难得这么好时间的CF,我直接找来队友组队练题当然比赛的过程没有三人三机,就跟平时训练一样搞了个新号三人一机的写中间因为溜去先看F了导致E题留给徐神solo因此出的偏慢,不过后面一起讨论了一下还是出了最后开F结果好家伙我和祁神双双看错题,对着假题意苦战1h最后无奈投降,......
  • Codeforces Round 902 (Div. 1, based on COMPFEST 15 - Final Round) A~D
    A.HelmetsinNightLight首先注意到一个关键性质\(b_i\geq1\),这就意味着当我们花\(p\)的代价解锁了\(b_i\)最小的后,仅凭接下来的“连锁反应”就能解锁全部的点。注意到我们“连锁反应”的一定是按\(b_i\)从小到大排序后的一段前缀(因为越往后连锁代价越昂贵),找到转折点......
  • AlexNet论文精读
    AlexNet......