首页 > 其他分享 >AutoBA:一个用于生信多组学分析的完全自动化AI代理

AutoBA:一个用于生信多组学分析的完全自动化AI代理

时间:2024-11-04 20:58:37浏览次数:4  
标签:分析 信息学 LLM AutoBA 代码 AI 生物 生信

分享一篇近期由华为阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作,相关成果发表在《Advanced Science》上。

图片

该文介绍了一个名为AutoBA(Automated Bioinformatics Analysis)的人工智能代理,它专门设计用于全面自动化的多组学分析。AutoBA基于大型语言模型(LLMs),能够简化分析流程,仅需最少的用户输入,同时为各种生物信息学任务提供详细的逐步计划。

AutoBA的整体框架设计

AutoBA是一个为传统多组学分析量身定制的自主AI代理。它通过用户提供的三个关键输入(数据路径、数据描述和最终分析目标)来自动分析数据、生成详细的逐步计划、编写代码、执行代码并进行深入分析。AutoBA作为开源软件实现,提供多个LLM后端,并支持在线和本地使用,优先考虑数据安全和用户隐私。

AutoBA的工作流程

AutoBA的工作流程包括规划阶段、代码生成阶段和执行阶段。在规划阶段,AutoBA详细概述了分析计划,包括每个步骤要使用的软件名称和版本,以及每个阶段的指导行动和特定子任务。在代码生成阶段,AutoBA根据计划生成子任务的代码,包括配置环境、安装必要的软件和编写代码。在执行阶段,AutoBA执行生成的代码。

图片

AutoBA的设计

AutoBA的记忆管理

AutoBA内置了记忆机制,使其能够通过参考先前行动来更有效地生成代码,避免某些步骤的不必要重复。在规划阶段,记忆被结构化为:“首先,您提供了输入格式为‘文件路径:文件描述’的列表:。您制定了一个详细计划来完成您的总体目标。您的总体目标是。您的计划涉及。”在代码生成阶段,记忆遵循以下格式:“然后,您成功完成了任务:,对应的代码:。”

AutoBA的自动代码修复(ACR)

AutoBA包含了一个自动代码修复(ACR)模块,旨在简化调试过程并提高生成代码的可靠性。在代码执行阶段,AutoBA从标准错误(stderr)和标准输出(stdout)的输出流中识别错误。一旦检测到错误,这些检测到的错误将被整合到代码再生的提示中,确保重复循环直到生成的代码成功执行无误。

AutoBA的评估

AutoBA的结果经过生物信息学专家的彻底验证,包括对提出的计划、生成的代码、代码执行以及结果的准确性和可靠性的确认。AutoBA的开发和验证基于特定的环境和软件堆栈,包括Ubuntu版本20.04、Python 3.10.0和openai版本0.27.6。这些环境和软件规格为AutoBA在生物信息学领域的功能性提供了坚实的基础,确保了其可靠性和有效性。

图片

AutoBA的评估

AutoBA的在线和本地LLM后端

AutoBA提供了几种LLM后端版本,包括基于ChatGPT-3.5和ChatGPT-4的在线后端,以及包括CodeLlama-7B-Instruct、CodeLlama-13B-Instruct、CodeLlama-34B-Instruct在内的本地LLMs。

AutoBA的安全性和安全性

AutoBA采用了沙箱模式来建立一个安全隔离的环境进行分析,有效保护底层系统免受潜在威胁。同时,AutoBA在执行阶段对系统命令施加限制,从而降低恶意命令在环境中执行的风险。此外,AutoBA利用Docker容器化,引入了额外的安全层来进一步加强整体系统完整性。

AutoBA在多种传统多组学分析场景中的应用

为了评估AutoBA的鲁棒性,研究者进行了涉及40个案例的评估,涵盖四种不同的组学数据:基因组学、转录组学、蛋白质组学和代谢组学。所有案例都由AutoBA独立分析,并随后由经验丰富的生物信息学专家进行验证。总体结果强调了AutoBA在生物信息学领域多种多组学分析程序中的多功能性和鲁棒性。

图片

图片

讨论

据作者所知,AutoBA是第一个明确为多组学数据分析量身定制的自主AI代理。AutoBA通过最少的用户输入简化分析流程,同时为各种生物信息学任务提供详细的逐步计划。AutoBA的一个关键优势是其对分析目标变化的适应性。此外,AutoBA的多功能性体现在其能够根据不同的输入数据自设计新的分析流程。这种自动适应性使AutoBA成为生物信息学家处理新颖或非传统研究问题时的宝贵工具。与当前流行的在线生物信息学分析平台相比,AutoBA通过提供在线版本和本地版本来解决隐私问题,从而消除了与第三方共享任何信息的需求。AutoBA还展示了其与新兴生物信息学工具的同步适应性,LLMs能够无缝地将这些最新工具纳入数据库。另一个区别特征是AutoBA的透明和可解释的执行过程,这允许专业生物信息学家轻松修改和自定义AutoBA的输出,利用AutoBA加快数据分析过程。AutoBA也是一个为生物信息学分析设计的面向未来的AI代理,利用LLMs作为其核心。这种设计允许AutoBA与任何现有的LLM集成,无论是在线(例如,ChatGPT、GPT-4、GPT-4o)还是离线(例如,LLaMA、CodeLLaMA和DeepSeek)。AutoBA使用的LLM是完全可替代的,使其能够从LLM技术的持续进步中受益。随着新的最先进的LLMs的发展,AutoBA可以整合它们以提高其在自动生物信息学分析中的性能。

尽管如此,AutoBA在工具选择上的限制仍然存在。当前的LLMs在互联网数据上进行训练,这意味着在生物信息学中广泛使用的方法通常训练得很好,而特定论文中的方法可能代表性不足或根本没有训练。因此,当使用经过广泛训练的工具时,可以获得最佳结果,这可能导致工具选择中的潜在偏见。为了解决这个问题,未来可以训练一个涵盖领域内所有工具和方法的专门的生物信息学LLM。考虑到用于大型语言模型的训练数据的时效性,值得注意的是,生物信息学中最近提出的方法可能仍然在自动生成代码方面对AutoBA构成挑战。因此,未来努力训练一个专门针对生物信息学的最新大型语言模型,可以显著提高AutoBA保持最新代码生成能力的能力。尽管如此,AutoBA代表了生物信息学领域的一个显著进步,提供了一个用户友好、高效和可适应的解决方案,用于广泛的组学分析任务。其处理不同数据类型和分析目标的能力,加上其鲁棒性和适应性,使AutoBA成为加速生物信息学研究的宝贵资产。作者预计AutoBA将在科学界得到广泛使用,支持研究人员从复杂的生物数据中提取有意义的见解。

总之,挺有意思的一个项目:https://github.com/JoshuaChou2018/AutoBA

J. Zhou, B. Zhang, G. Li, X. Chen, H. Li, X. Xu, S. Chen, W. He, C. Xu, L. Liu, X. Gao, An AI Agent for Fully Automated Multi-Omic Analyses. Adv. Sci. 2024, 2407094.

声明:转载请注明出处,违者必究。

图片

标签:分析,信息学,LLM,AutoBA,代码,AI,生物,生信
From: https://www.cnblogs.com/miyuanbiotech/p/18526285

相关文章

  • AI产品独立开发变现实战营
    亮点:1、三大真实商业项目,商业盈利、AI产品开发综合能力提升2、掌握一人公司、副业产品设计-开发-运营-盈利落地全流程3、大牛私藏AI盈利工具倾囊相授4、借势增加睡后收入,从容应对裁员大环境与年龄危机大纲:第1章独立开发的工作内容及职业路径第2章独立开发者的赚钱......
  • yolo训练环境在百度飞桨AIStudio平台持久化安装教程
    新建一个名为的yolo环境condacreate-nyolopython==3.8输入y,等待安装环境 下载完后,一定要用我下面的指令才能成功进入环境 进入yolo环境指令.activateyolo也是成功进入了yolo环境,然后就是安装自己需要的环境了我是先进入ultralytics文件夹,再配环境的(我用的是......
  • AI技术驱动行业变革,引领未来美好生活
      ===============  一、引言----  随着科技的飞速发展,人工智能(AI)逐渐成为了科技领域最为热门的话题之一。它的出现和快速发展不仅在科技圈内掀起了一股热潮,更是在各行各业带来了前所未有的变革。从医疗、教育到金融、交通,甚至娱乐等各个领域,人工智能的影子无处不在。今......
  • 把握人工智能行业脉搏!全球最值得关注的7大AI资讯平台
    序言:全球顶级的人工智能资讯网站都是以英文语言为主,如果大家看不懂,没关系,作者教大家一个技巧,用人工智能直接帮您看,然后直接让AI解析出您关注的重点内容给您,如果想了解详细信息,让人工智能一字不漏的翻译给你,就这么简单粗暴。在瞬息万变的人工智能领域,获取最新资讯、紧跟行业发展......
  • Java多线程编程(三)一>详解synchronized, 死锁,wait和notify
    目录: 一.synchronized的使用:   二. 常见死锁情况: 三.如何避免死锁:  四.wait和notify一.synchronized的使用: 我们知道synchronized锁具有互斥的特点:synchronized会起到互斥效果,某个线程执行到某个对象的synchronized中时,其他线程如果也执......
  • 主流AI Agent框架对比,让你轻松构建企业专属大模型!
    大模型的出现为AIAgent提供了足够聪明的“大脑”,并重新定义了AIAgent。各大科技公司正在投入巨额资金来创建AIAgent,包括OpenAI的SamAltman在内的许多专家都表示,AIAgent已成为下一个大热门方向。AIAgent是感知环境并采取行动以实现特定目标或目的的软件或系统。可以......
  • ​Meta AI推出思维偏好优化技术,提升AI模型回应质量
    近日,MetaAI的研究团队与加州大学伯克利分校及纽约大学的研究人员合作,推出了一种名为思维偏好优化(ThoughtPreferenceOptimization,TPO)的方法,旨在提升经过指令微调的大型语言模型(LLM)的回应质量。与传统模型仅关注最终答案不同,TPO方法允许模型在生成回应前进行内部思考......
  • 超市模拟器msvcp140_atomic_wait.dll缺失?轻松解决超市模拟器中的msvcp140_atomic_wait
    面对超市模拟器中msvcp140_atomic_wait.dll缺失的问题,用户无需过于担心,因为有多种方法可以帮助轻松解决这一错误提示。以下是一些有效的解决方案:一、重新安装VisualC++Redistributablemsvcp140_atomic_wait.dll是MicrosoftVisualC++2015RedistributablePackage的一部......
  • 【AI换脸整合包及教程】《FaceFusion 3.0.0:AI 换脸魔法,开启奇幻之旅》
    嘿,你是否曾幻想过自己成为电影中的超级英雄,或是穿越时空与历史名人相遇?如今,这个梦想不再遥不可及,因为有了神奇的FaceFusion3.0.0!在这个充满科技奇迹的时代,AI换脸技术如同一颗璀璨的明星,照亮了我们的创意世界。而FaceFusion3.0.0更是其中的佼佼者,以其独特的魅力和强大的......