Google Tx-LLM：用大型语言模型助力治疗药物开发

时间：2024-10-17 23:19:24浏览次数：10

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

Tx-LLM是一款专门优化，用于预测生物实体属性的大型语言模型（LLM），它覆盖了整个治疗药物开发管道，从早期靶点发现到晚期临床试验批准。

治疗药物的临床试验失败率高，即便成功，通常也需要10到15年、耗资10到20亿美元才能开发完成。原因在于开发过程繁琐，且治疗药物需要满足多种独立标准。比如，药物必须与特定靶点结合，避免与其他实体产生作用，从而实现所需功能而不引发副作用。此外，药物还需要有效抵达目标部位、在体内适时清除，并能够规模化生产。实验测量这些特性费时费钱，因而使用机器学习（ML）进行快速预测成为一种替代方案。

因此，Tx-LLM应运而生。该模型基于PaLM-2进行了微调，能够预测与药物开发相关的多个实体属性，如小分子、蛋白质、核酸、细胞系及疾病等。Tx-LLM在66个药物发现数据集上进行了训练，覆盖从早期靶基因识别到临床试验批准的多个环节。在43项任务上，Tx-LLM的表现达到了当前最先进模型的水平，并在22项任务上超越了它们。值得注意的是，Tx-LLM不仅可以结合分子信息与文本信息，还能在不同类型的治疗任务之间实现能力迁移，成为贯穿药物开发全流程的单一模型。

Tx-LLM的训练依赖精心整理的"治疗指令调优"（TxT）数据集，它涵盖709个与治疗药物开发相关的数据集。通过将Therapeutic Data Commons（TDC）中的66项任务数据转化为适合LLM训练的指令-回答格式，Tx-LLM得以提升其在多种任务上的表现。TxT数据集的构建不仅依赖TDC，还引入了文献中的额外信息，使得模型能够区分子任务。此外，部分特性直接以文本形式展示（如细胞系），这使得模型能更好地利用其自然语言预训练能力。

在性能测试中，Tx-LLM在许多任务上展现了强大的数值预测能力，这在以往的LLM中并不常见。特别是在处理小分子与文本结合的任务时，Tx-LLM表现尤其出色。例如，在给定药物和疾病名称的情况下预测药物是否会被批准，Tx-LLM的表现优于现有的顶尖模型。

虽然Tx-LLM在多个任务中表现出色，但它仍有改进空间，特别是在解释其预测结果时。未来，随着模型继续发展，它可能会对整个治疗药物开发过程产生深远影响，大幅缩短开发时间、降低成本。

目前，团队正评估如何将Tx-LLM的能力开放给外部研究人员使用。如果有兴趣探索该模型的应用，欢迎与团队联系。了解外部的实际需求将有助于推动模型的进一步优化与发展。

标签：Google,Tx,药物,模型,任务,开发,LLM
From： https://blog.csdn.net/2301_79342058/article/details/143030851

图论day64 ：最短路径算法 | SPFA（Bellman_ford的队列优化版）、城市间货物运输 I、Ⅱ、Ⅲ
图论day64：最短路径算法|SPFA（Bellman_ford的队列优化版）、94.城市间货物运输I（卡码网）【SPFA算法+邻接表优化】、95.城市间货物运输II（判断负权回路）、96.城市间货物运输III【已知有负权回路，该如何计算】、Bellman_ford算法思维导图汇总SPFA（Bellman_ford的队列优化版）94......
Ollama + LangChain: 本地运行LLM大语言模型
简介在大型语言模型（LLM）领域，Ollama和LangChain已经成为开发人员和研究人员的强大工具。Ollama提供了一种无缝本地运行开源LLM的方式，而LangChain提供了将模型灵活集成到应用程序中的框架。本文将介绍如何设置和使用Ollama和LangChain，以便能够在项目中利用LLM的强大功能。搭建Ollam......
txtai: 一个强大的开源嵌入式数据库和语言模型工作流框架
txtaitxtai:强大的开源嵌入式数据库和语言模型工作流框架txtai是一个功能强大的开源嵌入式数据库和语言模型工作流框架,由NeuML团队开发。它为构建语义搜索、大语言模型(LLM)应用和智能工作流提供了一站式解决方案。主要特性txtai具有以下主要特性:......
Bard-API:非官方的Google Bard Python接口包
Bard-APIBard-API:非官方的GoogleBardPython接口包Bard-API是一个非官方的Python包,为开发者提供了一种简便的方式来访问和使用GoogleBard的功能。该项目由GitHub用户dsdanielpark开发和维护,旨在通过cookie值与GoogleBard进行交互,从而实现对Bard功能的调用。项目背景Goo......
大模型（LLM）最新研究论文介绍（合集）
目录\1.CTRLA:通过探针引导控制的自适应检索增强生成\2.压缩大型语言模型：使用低秩和低精度分解方法\3.通过LLM知识转移增强零样本面部表情识别\4.大型语言模型（LLMs）：部署、代币经济学与可持续性\5.审视大型语言模型提示策略以自动评估学习者创建的计算成果———......
UCB CS194/294-196 (LLM Agents) Lecture 4 (2024.10.1)
预备知识英文缩写&术语英语简中补充LargeLanguageModel(LLM)大语言模型ArtificialGeneralIntelligence(AGI)通用人工智能一个远大的目标Agent智能体/代理Embody具身Multi-AgentSystem(MAS)多智能体系统Token文本分割后得到的最小语义单位Prompt提示词我们向AI提出的......
代码随想录训练营第64天|bellman_ford
47.参加科学大会#include<iostream>#include<vector>#include<list>#include<queue>#include<climits>usingnamespacestd;//小顶堆classmycomparison{public:booloperator()(constpair<int,int>&lhs,constpai......
[20241016]Oracle C functions annotations补充.txt
[20241016]OracleCfunctionsannotations补充.txt--//网站orafun.info可以查询oraclecfunctions.CreatedbyFritsHooglandwithalittlehelpfromKamilStawiarski.--//可以通过它了解oracle内部C函数.实际上可以直接下载相关文件,在本地使用.https://gitlab.com/Frits......
MP4 转 TXT 项目与 M3U8 下载脚本
项目背景在当今信息社会，视频学习已成为一种重要的知识获取方式。然而，许多用户在观看视频的过程中，效率往往低于预期。为了提升学习效率，我们决定开发一个将MP4视频转换为TXT文稿的项目。此外，很多视频在微信网页上播放，无法直接下载，主要采用M3U8格式进行流式传输。这促使我们寻......
Nvidia RTX Desktop Manager跳过硬件要求
相信大家看了上一篇文章，肯定还想继续白*英伟达。所以今天我给大家带来了NvidiaRTXDesktopManager跳过硬件要求的教程。如果要跳过硬件要求的话，还是改NVI文件。由于NVI文件非常多，这里我就不一一介绍怎么删除了。如果感兴趣的朋友可以自己研究。这里我就直接放出懒人包了。......

Google Tx-LLM：用大型语言模型助力治疗药物开发

相关文章

赞助商

阅读排行