首页 > 编程语言 >DeepMind今日发布并开源其最先进AI蛋白质预测工具AlphaFold3程序代码

DeepMind今日发布并开源其最先进AI蛋白质预测工具AlphaFold3程序代码

时间:2024-11-12 10:45:54浏览次数:3  
标签:AI 代码 发布 杂志 DeepMind 团队 AlphaFold3 程序代码

“迟来总比没有好”!Google DeepMind今日向充满期待的学术界公开了其最新人工智能蛋白质预测软件的源代码。尽管部分科学家对DeepMind耗费六个月时间才公布代码表示不满,但绝大多数科研人员对此表示欢迎。

在这里插入图片描述
5月8日,DeepMind在《自然》杂志上发表文章,宣布推出了AlphaFold3,该技术不仅能够预测蛋白质结构,还能预测其与DNA、RNA和其他蛋白质的相互作用,这对于药物发现等领域具有重大意义。

然而,他们对技术的发布方式提出了批评:尽管《自然》杂志的编辑指南要求发表的研究必须提供计算代码,但该论文仅提供了“伪代码”——即程序运行步骤的描述——以及一个每天只允许有限次数预测的在线门户链接。这与DeepMind在2021年《自然》杂志上发表的提供完整代码的AlphaFold2形成了鲜明对比,违背了公认的开放性、可重复性和同行评审的标准。在一封获得数百人签名支持的公开信中,研究人员明确指出了这一点。

面对抵制,DeepMind承诺在论文发表后六个月内向非商业用户公开全部代码。如今,它履行了这一承诺。

该计算模型已在代码存储库GitHub上以非商业许可证的形式公开发布,而用于调整AI模型的“权重”(数值)也可供完成简短申请表的学者使用。

DeepMind科学副总裁Pushmeet Kohli表示:“我们感谢社区的耐心等候。”尽管他和他的团队坚信他们发布的程序是正确的,但Kohli承认社区希望直接使用代码。他补充说,为了今天的公开发布,他们花费了数月时间准备和测试模型。

对此,研究人员表示欢迎。斯德哥尔摩大学的生物物理学家埃里克·林达尔,也是公开信的签署人之一,表示:“我很高兴看到DeepMind团队履行承诺,公开代码,这意味着对一篇重要论文的深入审查终于可以开始了。”范德堡大学的计算结构生物学家斯蒂芬妮·万科维兹,公开信的组织者之一,补充说:“所发布的模型和权重对于评估和在此基础上进一步研究都具有重要意义。”但她同时指出,“六个月的延迟是不可接受的。”

AlphaFold3是最新的AlphaFold版本,它是一种基于氨基酸序列的蛋白质结构预测AI,今年早些时候,它凭借这一技术为DeepMind的两位研究员约翰·朱默和德米斯·哈萨比斯赢得了诺贝尔化学奖的提名。然而,直到今天,研究人员只能通过DeepMind的在线门户使用该程序,每天仅限10个(现为20个)请求,且只能处理有限的分子集合。

《自然》杂志主编玛格达莱娜·斯基珀在今年5月的声明中没有具体说明为何放弃了分享完整代码的要求,但她提到编辑们考虑了“生物安全的潜在影响以及由此带来的伦理挑战”。同时,《自然》杂志的一篇新闻报道引用科赫的话称,团队限制了AlphaFold3的访问权限,以避免影响DeepMind的商业子公司Isomorphic Labs的药物研发计划。科利向《科学》杂志透露,DeepMind团队优先开发了这个门户,而不是发布代码,“以确保我们为最多的人提供了最简单的界面。”朱默表示,通过这个门户,研究人员已经完成了一些“令人难以置信的工作”,而这一工作在今天的新闻发布后并未改变。他怀疑大多数科学家将继续以这种方式工作,因为这对那些计算能力有限的团队来说更为实用。

DeepMind的研究人员还反驳了一些批评者的说法,称《自然》杂志上的论文是可以重复的,因为有多个团队已经基于伪代码开发了自己的AlphaFold3版本。百度、Ligo Biosciences和Chai Discovery等专注于AI的公司已经发布了这些努力的结果。伦敦大学学院的生物信息学研究员丹尼尔·布坎指出,这些替代“实现”方案在AlphaFold 3的代码现已公开的情况下,仍可能很有用。“能够重现方法是件好事,也是很重要的,”他说。万科维兹补充称,比较和对比这些模型可能会在未来带来改进。研究人员表示,尤其重要的是那些不受限制的用户许可证的实施方案,比如非营利组织OpenFold联盟正在开发的方案。否则,“如果我帮助一位同事设计出一种可能成为潜在抗癌药物的全新配体,而某天他们想与制药公司合作将其商业化,事情就会变得非常复杂,”福克斯蔡斯癌症中心的计算结构生物学家罗兰·邓布拉克说。他最初被要求为《自然》杂志审阅DeepMind的手稿,但从未收到代码以进行审阅。已经有一些研究团队计划与AlphaFold3的代码合作。

今天发表在《自然计算科学》杂志上的一篇论文的作者表示,他们希望将AlphaFold3整合到自己的软件中。这款名为MassiveFold的程序可以帮助用户利用并行计算来缩短在AlphaFold2上运行大量预测所需的时间——从数月缩短至数小时。

法国国家科研中心的生物信息学研究员、MassiveFold开发者Guillaume Brysbaert表示,通过整合DeepMind的新代码,“用户可以从AlphaFold2或AlphaFold3中获得最佳预测结果”。朱默说,DeepMind团队期待着今天公开发布的成果。“在AlphaFold2中,我们看到了很多创造力,”他说。“我真的很兴奋地想看看社区会发现AlphaFold3是如何工作的——它如何应用于新的问题?”

参考文献:https://www.science.org/content/article/google-deepmind-releases-code-behind-its-most-advanced-protein-prediction-program

标签:AI,代码,发布,杂志,DeepMind,团队,AlphaFold3,程序代码
From: https://blog.csdn.net/weixin_41446370/article/details/143702835

相关文章

  • 自定义 LangChain 组件:打造专属 RAG 应用
    引言在构建专业的检索增强生成(RAG)应用时,LangChain提供了丰富的内置组件。然而,有时我们需要根据特定需求定制自己的组件。本文将深入探讨如何自定义LangChain组件,特别是文档加载器、文档分割器和检索器,以打造更加个性化和高效的RAG应用。自定义文档加载器LangChain的文档......
  • 深入理解 LangChain 文档分割技术
    引言随着大语言模型(LLM)的快速发展,检索增强生成(Retrieval-AugmentedGeneration,RAG)技术已成为构建知识密集型AI应用的关键方法。本文将深入介绍RAG应用开发中的核心环节-文档处理,重点讲解LangChain框架中的文档处理组件和工具。RAG应用架构概述在RAG应用中,文档......
  • LangChain 向量存储与检索技术详解
    引言在RAG(检索增强生成)应用中,向量存储和检索是连接文档处理和LLM生成的关键环节。本文将深入探讨LangChain中的向量存储和检索技术,包括常用的向量数据库、嵌入模型以及高效的检索策略。向量存储基础向量存储是将文本转换为高维向量并进行存储和检索的技术。在RAG应用中,......
  • 在华为开发者空间,简单几步带你实现AI风格化编程
    摘要:通过调用ModelArts上的动漫头像制作应用,将头像图片转化为动漫风格的头像图片。本文分享自华为云社区《【开发者空间实践指导】基于FunctionGraph的AI风格化编程》,作者:开发者空间小蜜蜂。一、案例介绍本实验基于FunctionGraph和ModelArts的智能头像动漫化处理应用。......
  • Bootstrap vs TailwindCSS
    在为您的网页设计项目选择Bootstrap和TailwindCSS之间犹豫不决?以下是帮助您做出决定的快速概述:Bootstrap提供了即用型组件,便于快速开发,但定制性有限。TailwindCSS提供了实用类,设计高度可定制,但需要更多的前期工作。性能:TailwindCSS通过删除未使用的样式,可能使您的网......
  • RL 基础 | 如何使用 OpenAI Gym 接口,搭建自定义 RL 环境(详细版)
    参考:官方链接:Gymdocumentation|Makeyourowncustomenvironment腾讯云|OpenAIGym中级教程——环境定制与创建知乎|如何在Gym中注册自定义环境?g,写完了才发现自己曾经写过一篇:RL基础|如何搭建自定义gym环境(这篇博客适用于gym的接口,gymnasium接口也差不......
  • 使用YOLOv8训练无人机检测数据集10158张 txt格式小目标检测 txt标注 标签名UAV 图片与
    准备工作安装依赖首先,确保你的开发环境中安装了必要的软件和库。YOLOv8是基于PyTorch框架的,因此你需要安装Python以及PyTorch。安装Python(推荐3.7或更高版本)安装PyTorch:你可以从PyTorch官方网站获取安装命令,根据你的系统配置选择合适的安装方式。克隆YOLOv8的官方仓库......
  • 如何使用YOLOv8进行训练变电站电力设备缺陷数据集 共6004张图像 train test val比例为
    表计读数异常、表计外壳破损、异物鸟巢、空中漂浮物、表盘模糊、表盘破损、绝缘子破裂、地面油污、硅胶桶变色变电站电力设备缺陷数据集共6004张图像traintestval比例为7:2:1有txt和yaml两种格式数据集共7种标签,包括表计读数异常、表计外壳破损、异物鸟巢、空中漂浮......
  • [题解](更新中)Refact.ai Match 1 (Codeforces Round 985)
    A-Set显然答案是\(\max(\lfloor\frac{r}{k}\rfloor-l+1,0)\)。点击查看代码#include<bits/stdc++.h>#defineintlonglongusingnamespacestd;intt,l,r,k;signedmain(){ cin>>t; while(t--){ cin>>l>>r>>k; cout<<max(0ll,......
  • gcc-13.2 grpc 编译错误(absl-cpp build fails)
    使用gcc-13.2编译absl-cpp会出现以下报错:third_party/abseil-cpp/absl/strings/internal/str_format/extension.h:34:6:warning:elaborated-type-specifierforascopedenummustnotusethe‘class’keyword  34|enumclassFormatConversionChar:uint8_t; ......