[论文精读][基于点云的蛋白-配体亲和力]A Point Cloud-Based Deep Learning Strategy for Protein-Ligand Binding Affinity

时间：2023-10-13 10:57:08浏览次数：44

标签：1024 精读 Based 亲和力 Prediction 原子配体点云蛋白

我需要的信息

代码，论文
不考虑共价键，每个点包括了六种原子信息，包括xyz坐标，范德华半径，原子重量以及来源（1是蛋白质，-1是配体）。原子坐标被标准化，其它参数也被标准化。对不足1024个原子的的复合体，补0到1024。
增加考虑的原子从1024到2048，没有提升，增加原子信息通道，没有提升（见result）

Abstract

基于AI的蛋白质-配体亲和力模型可用于药物发现
本文首次使用PointNet和PointTransformer来做亲和力
有效学习，而且PointTransformer学习到的蛋白配体互作用特征可以适用于XGBoost，在预测任务上和sota水平相当。
结果表明三维点云算法可以有效学习到PDBbind数据集里的自然进化和化学机制等知识

Introduction

以前的方法

分子表述：FPRC, PerSpect, PSH
2D互作用图：DeepBindRG
3D体素：KDeep, AK-Score, DeepAtom
图数据：Graph-CNN, GraphBAR

点云方法

猜想点云方法可以比体素方法更快更简单。
点云中的每个点代表蛋白质配体结构中的一个现有原子，这一显著特征将有助于通过可视化来解释已开发的模型
两种模型的Pearson correlation coefficient都测试了
把输入后的特征给到XGBoost，预测结果和sota的机器学习方法相当。

Methods

Dataset

使用精细化过的PDBbind-2016，包括4057个蛋白-配体复合物数据。3772个数据是训练集和验证集，其他的core set是测试集。
还使用了general的PDBbind-2016，含有肽复合物的被删去，复合物不足的被删去，测试集删去。得到11 327的训练集。
以配体为中心，选取最近的1024个蛋白原子。
不考虑共价键，每个点包括了六种原子信息，包括xyz坐标，范德华半径，原子重量以及来源（1是蛋白质，-1是配体）。原子坐标被标准化，其它参数也被标准化。对不足1024个原子的的复合体，补0到1024。
为调查输入，还做了两个实验：增加原子种类的channels，原子采样从1024增加到2048

Comparison of pre-processing and inference time of different models

使用c++加速点云的生成还和体素的方法进行了时间的比对

PointNet and PointTransformer architecture and training

网络框架大概长这样，然后强调了，原子输入顺序不影响结果因为有我们的Max Pool。这个在pointnet++里也是一样的。
训练的时候把点云翻转了24次，相当于数据集增加了24倍。测试的时候把输入翻转24次，取预测的平均值。

Result

其它result笔者不感兴趣，略

标签：1024,精读,Based,亲和力,Prediction,原子,配体,点云,蛋白
From： https://www.cnblogs.com/sherrlock/p/17761564.html

Fi-GNN: Modeling Feature Interactions via Graph Neural Networks for CTR Predicti
目录概Fi-GNN代码LiZ.,CuiZ.,WuS.,ZhangX.andWangL.Fi-GNN:Modelingfeatureinteractionsviagraphneuralnetworksforctrprediction.CIKM,2019.概"图网络"用在精排阶段(算哪门子图网络啊).Fi-GNN一个item可能有多种field,比如:\[\underbrace......
C++11新特性之基本范围的For循环（range-based-for）
C++11新特性之基本范围的For循环（range-based-for）最新推荐文章于 2023-07-2219:30:58 发布Rayen0715于2017-01-0713:49:35发布49588收藏174版权Range-Based-For熟悉C++98/......
2023ICCV_Retinexformer: One-stage Retinex-based Transformer for Low-light Image
一.Motivation(1)Retinex理论没有考虑到噪声，并且基于Retinex分解的网络通常需要很多阶段训练。(2)直接使用从CNN从低光图像到正常光图像的映射忽略了人类的颜色感知，CNN更适合捕获局部信息，对于捕获远程依赖和非局部自相似性方面存在局限。二.Contribution(1)设计了一个阶段......
Attribute Based Group Signature with Revocation
AttributeBasedGroupSignatureswerefirstintroducedin[12].Itwasproposedtoservethepurposeofincludingattributesinagroupsignaturescheme.GroupSignaturesallowamemberofagrouptosignonbehalfoftheotherswhileinABGSschemesthe......
Codeforces Round 707 (Div. 2, based on Moscow Open Olympiad in Informatics) B. N
按以下\(n\)次操作制作蛋糕。叠上第\(i\)块面包，然后浇上\(a_i\)单位的奶油。可以使当前往下\(a_i\)块面包沾上奶油。输出空格隔开的\(n\)个数，第\(i\)个的\(0/1\)代表第\(i\)块面包是否沾有奶油。比较显然的思路可以进行差分修改。view1#include<bits/std......
Codeforces Round 902 (Div. 2, based on COMPFEST 15 - Final Round)
目录写在前面ABCDE写在最后写在前面比赛地址：https://codeforces.com/contest/1877。呜呜铃果唱歌太好听了、、、我宣布是第二喜欢的声线，第三喜欢是东北切蒲英，第一喜欢绝赞招募中。这下不得不成为数码推了、、、A答案为\(-\suma_i\)。懒得写代数式子推了，赛时看完题直接......
(2023年新疆大学、中科院等点云分类最新综述) Deep learning-based 3D point cloud cl
目录1、引言2、3D数据2.1、3D数据表示形式2.2、点云数据存储格式2.3、3D点云公共数据集3、基于深度学习的点云分类方法3.1、基于多视角的方法3.2、基于体素的方法3.3、基于点云的方法3.3.1局部特征聚合3.3.1.1基于逐点处理的方法3.3.1.2基于卷积的方法3.3.1.3基于图的方法3.3.1......
Codeforces Round 902 (Div. 2, based on COMPFEST 15 - Final Round)
Preface难得这么好时间的CF，我直接找来队友组队练题当然比赛的过程没有三人三机，就跟平时训练一样搞了个新号三人一机的写中间因为溜去先看F了导致E题留给徐神solo因此出的偏慢，不过后面一起讨论了一下还是出了最后开F结果好家伙我和祁神双双看错题，对着假题意苦战1h最后无奈投降，......
Codeforces Round 902 (Div. 1, based on COMPFEST 15 - Final Round) A~D
A.HelmetsinNightLight首先注意到一个关键性质\(b_i\geq1\)，这就意味着当我们花\(p\)的代价解锁了\(b_i\)最小的后，仅凭接下来的“连锁反应”就能解锁全部的点。注意到我们“连锁反应”的一定是按\(b_i\)从小到大排序后的一段前缀（因为越往后连锁代价越昂贵），找到转折点......
AlexNet论文精读
AlexNet......