首页 > 其他分享 >AI与药学 | Med-Pal:轻量级大型语言模型在药物咨询领域的应用

AI与药学 | Med-Pal:轻量级大型语言模型在药物咨询领域的应用

时间:2025-01-20 21:29:34浏览次数:3  
标签:Med AI 药学 模型 LLM Pal 轻量级

随着新冠疫情的催化,数字医疗正以前所未有的速度发展,传统的面对面医疗服务模式逐渐向线上转移。数字健康工具的普及提升了患者的健康素养,也为医护人员带来了更沉重的文书工作和认知负担。大型语言模型 (LLMs) 的出现,为解决这一矛盾提供了新的可能。LLMs 在经过优化后,有望成为总结临床文件、回答患者咨询的得力助手,从而促进以患者为中心的护理模式,提高医疗效率。(关注公众号“赛文AI药学”,获取更多AI与药学的内容)

然而,将通用型 LLM 直接应用于临床实践还面临诸多挑战,例如:回复缺乏一致性、存在偏见、事实准确性欠佳等问题。为了提升 LLM 在医疗领域的应用价值,研究人员开发了多种方法,包括使用生物医学领域知识或电子健康记录预训练 LLM (例如 Med-Palm-2、GatorTron),使用精选数据集对 LLM 进行微调,或使用检索增强生成 (RAG) 技术为 LLM 提供医学领域知识。

尽管如此,在实际部署基于 LLM 的医疗聊天机器人时,还需要考虑长期可扩展性、健康公平性、数据安全、成本效益、计算效率、推理速度以及跨平台访问等问题。特别是对于网络连接受限的地区,能够在设备本地运行的轻量级 LLM 更具优势,有助于减轻与数字连接相关的健康差距,并降低数据隐私风险。

Med-Pal:专为药物咨询而生的轻量级 LLM 聊天机器人

本文介绍了一款名为 Med-Pal 的轻量级、特定领域的 LLM 聊天机器人,它专注于药物咨询领域,旨在为患者提供安全、可靠、易于理解的药物信息。该研究详细阐述了 Med-Pal 的全面开发、临床评估和对抗性提示框架,并将其性能与最先进的预训练轻量级生物医学 LLM (Biomistral) 和微调医疗 LLM (Meerkat) 进行了基准测试。

Med-Pal 的构建:精益求精,打造专业可靠的 AI 药剂师

Med-Pal 的开发团队深知医疗领域应用的特殊性和重要性,因此采用了严谨的三阶段开发流程,确保模型的专业性和安全性:

第一阶段:数据为王,精选模型

  • 专家构建,精细数据集: 团队精心构建了一个包含 1100 个问答对的细粒度训练数据集。该数据集涵盖了新加坡健康服务系统内住院和门诊亚专科诊所最常用的 110 种药物,覆盖了 14 种不同的解剖治疗分类 (ATC) 和 12 个广泛的药物咨询领域,例如药物管理、不良反应、禁忌症、剂量方案、药物相互作用等。每个问答对均由拥有超过 10 年经验的注册临床药剂师创建,确保了数据的专业性和权威性。

  • 多模型微调,择优选取: 研究团队选择了五个开源 LLM (Llama-7b、Falcon-7b、Mistral-7b、Danube-1.8b 和 TinyLlama-1.1b) 进行微调,并采用了一致的超参数配置,以确保公平比较。通过在验证集上的表现评估,Mistral-7b 以其最高的总分和在安全性和准确性方面的优异表现脱颖而出,被选为 Med-Pal 的基础模型。

第二阶段:严格测试,验证性能

  • 多学科评估,客观公正: 团队邀请了一个由注册医师、药剂师和护士组成的 8 人多学科团队,对 Med-Pal (微调后的 Mistral-7b) 与 BioMistral 和 Meerkat 进行比较评估。评估采用 SCORE 标准,从安全性、临床准确性、客观性、可重复性和易于理解五个方面衡量聊天机器人的性能。

  • 性能卓越,媲美先进模型: 测试结果表明,Med-Pal 的性能与 BioMistral 和 Meerkat 相当,在中位数总分上三组之间存在显著差异。Med-Pal 和 Meerkat 的总体性能均优于 BioMistral,而 Med-Pal 和 Meerkat 的总体性能在统计上没有差异。这证明了针对特定任务微调通用 LLM 的有效性。

第三阶段:多重防护,安全保障

  • 对抗性提示,攻防演练: 为了确保 Med-Pal 的安全性,团队设计了各种对抗性提示,例如提示注入、越狱、提示泄漏等,并对 Med-Pal 进行了测试。测试结果表明,Med-Pal 能够对这些恶意提示做出适当的回应,有效避免了信息泄露和误导性信息的产生。

  • 层层把关,安全至上: 研究团队还利用 "llm-guard" 库实施了复杂的防护栏机制,包括先发制人的内容准则和双层扫描方法,对不当或有害的医疗建议进行过滤。这种有条不紊的方法不仅可以保护用户免受不准确或危险的建议的侵害,还可以强调在医疗健康领域应用 AI 的道德标准。

Med-Pal 的优势:轻量化、专业化、安全化

  • 轻量级部署,普惠医疗: Med-Pal 基于 70 亿参数的轻量级模型,对计算资源的需求较低,可以部署在智能手机等边缘设备上。这使得 Med-Pal 可以在互联网连接受限的地区 (例如低收入和中等收入国家/地区) 正常工作,有助于弥合数字鸿沟,促进健康公平性。

  • 专业知识,精准解答: 通过专家构建的药物咨询数据集的微调,Med-Pal 掌握了丰富的药物知识,能够针对各种药物相关问题提供专业的解答。

  • 严格评估,安全可靠: 经过多学科临床专家团队的评估和对抗性提示测试,Med-Pal 的安全性、临床准确性和客观性得到了充分验证。

  • 用户友好,易于理解: Med-Pal 的回复简洁明了,避免使用复杂的医学术语,并根据用户的理解水平进行调整,确保信息的可理解性。

Med-Pal 的意义:推动数字医疗的创新与发展

Med-Pal 的开发是轻量级 LLM 在医疗领域应用的重要里程碑。它不仅为患者提供了一个便捷、可靠的药物信息获取途径,也为医疗专业人员减轻了工作负担。更重要的是,Med-Pal 的轻量级特性使其能够在资源受限地区发挥重要作用,推动数字医疗的普及,让更多人享受到 AI 技术带来的便利。

未来展望:持续改进,精益求精

尽管 Med-Pal 已经展现出强大的潜力,但仍需进一步的严格评估和改进。未来的工作将包括:

  • 扩展数据集: 不断扩充和更新训练数据集,涵盖更广泛的药物和问题类型。

  • 增强可重复性: 改进模型架构和训练方法,提高模型回复的可重复性。

  • 引入伦理评估: 采用特定于伦理的评估清单,确保模型输出的公平性和一致性。

  • 持续质量改进: 建立持续的质量改进和模型管理机制,解决模型偏差和模型漂移等问题。

  • 用户反馈机制: 引入用户反馈机制,收集用户对聊天机器人回复的意见和建议,进一步提升 Med-Pal 的可用性。

Med-Pal 作为一款专为药物咨询而生的轻量级 LLM 聊天机器人,展现了 AI 技术在医疗领域的巨大潜力。它以其轻量化、专业化、安全化的特点,为构建更加智能、便捷、公平的医疗健康体系贡献了重要力量。相信在不久的将来,像 Med-Pal 这样的 AI 助手将成为我们日常生活中不可或缺的一部分,为我们的健康保驾护航。

关键词: 大型语言模型 (LLM),轻量级模型,药物咨询,数字医疗,人工智能,医疗聊天机器人,微调,检索增强生成 (RAG),临床应用,数据安全,健康公平性

往期内容荐读:

数智药学的崛起:人工智能赋能药学新未来

数智药师:AI时代药学服务的引领者

智能决策助力药物安全:大模型在临床处方审核中的突破

数字人技术在药学服务中的应用

药师必备:掌握AI,引领药学服务新时代

LEADER - 大模型蒸馏的药物推荐模型

李新刚:《医院药学的创新引擎:ChatGPT的应用与思考》

ChatGPT 在临床药学中的有效性以及人工智能在药物治疗管理中的作用

评估大语言模型在药物基因组学问答任务中的表现:PGxQA

DDI-GPT:使用知识图谱增强的大模型对药物相互作用进行可解释的预测

生成式AI:药学科普的新引擎

诺奖得主David Baker最新Science论文:药学+AI领域迎来新机遇!

AI与药学:ChatGPT与临床培训——药学博士(Pharm-D)学生的看法、担忧和实践

人工智能大模型在用药处方审核的应用潜力:一项跨 12 个临床专科的前瞻性研究

生成式人工智能在中医药学教育中的应用与挑战

PharmacyGPT: AI赋能精准ICU药物治疗

数智药学:信息药师向AI药师的进化

AI用于研究药物扩大适应症:大模型架起药物分子结构与适应症的桥梁

AI与药学:DrugGPT助力减少英国每年2.37亿次用药错误

AI时代下的家庭药师

AI与药学:用药咨询场景的检索增强AI大模型

AI与药学:生成式人工智能如何帮助构建患者药品说明书?

AI与药学:ChatGPT在抗感染治疗中的应用与挑战

AI与药学:大语言模型赋能药物推荐

CancerGPT :基于大语言模型的罕见癌症药物对协同作用少样本预测研究

AI与药学|DAPSNet:基于双重注意力机制和患者相似性的药物推荐模型

AI与药学| Nature Medicine:大模型MEDIC显著降低药店用药指导错误

AI与药学:机器学习预测早期结肠癌中奥沙利铂的疗效

AI与药学:基于大模型的多智能体药物不良事件提取系统—MALADE

FastRx:基于 Fastformer 和记忆增强图神经网络的个性化用药推荐模型

AI与药学|基于知识图谱增强的泛癌症问答大模型框架

欢迎关注公众号“赛文AI药学”!

赛文AI药学,致力于探索人工智能在药学场景中的创新与应用。

标签:Med,AI,药学,模型,LLM,Pal,轻量级
From: https://blog.csdn.net/simoncool23/article/details/145269382

相关文章

  • AI在线将自己的照片转化为一幅精美的水彩画
    如果你曾经想过将自己的照片转化为一幅精美的水彩画,但又不具备绘画技巧,img4you的在线水彩画转换工具将是你的完美选择。这个平台运用了最先进的AI技术,让每个人都能轻松把自己的照片转化为充满艺术感的水彩画作品,无需任何专业技能。https://www.img4you.com/style-transfer操作非......
  • AAAI2024论文解读|Bidirectional Contrastive Split Learning for Visual Question An
    论文标题BidirectionalContrastiveSplitLearningforVisualQuestionAnswering双向对比分裂学习用于视觉问答论文链接BidirectionalContrastiveSplitLearningforVisualQuestionAnswering论文下载论文作者YuweiSun,HideyaOchiai内容简介本文提出了一种名......
  • 使用LangChain快速构建LLM应用程序指南
    LangChain新手指南:快速构建LLM应用程序在这篇文章中,我们将深入探讨如何使用LangChain快速上手LLM应用开发。从基础应用到高级功能,我们将通过代码实例帮助您理解并实现这些技术。技术背景介绍随着大语言模型(LLM)的发展,构建智能应用程序变得越来越普遍。LangChain作为一个强......
  • 使用AI API的全球支持和应用指南
    技术背景介绍随着人工智能(AI)的迅猛发展,越来越多的企业和开发者开始集成AIAPI服务以提升产品的智能水平和用户体验。全球范围内,AIAPI的应用逐步渗透到各个行业。然而,了解所处地区是否支持访问这些服务是首先需要解决的问题。核心原理解析AIAPI通常托管在云端服务器上......
  • 阳振坤:AI 大模型的基础是数据,AI越发达,数据库价值越大
    2024年1月12日,第四届OceanBase数据库大赛决赛在北京圆满落幕。在大赛的颁奖典礼上,OceanBase首席科学家阳振坤老师为同学们献上了一场主题为“爱上数据库”的公开课,他不仅分享了个人的成长历程,还阐述了对数据库行业现状与未来的见解和思考。阳老师回忆了自己年轻时,与如今的同......
  • AI技术的动漫角色转真人视频制作及其传播效果研究
    基于AI技术的动漫角色转真人视频制作及其传播效果研究一、引言随着互联网技术的快速发展,短视频内容已成为社交媒体平台上用户互动和分享的重要组成部分。其中,动漫角色cosplay视频因其独特的创意和视觉效果而备受青睐。然而,传统cosplay视频制作需要真人参与扮演,对参与者的外......
  • 强大的Adobe ME(Adobe Media Encoder)视频编码和格式转换软件
    AdobeME软件简介AdobeME(AdobeMediaEncoder)是一款强大的视频编码和格式转换软件,专为视频制作、后期编辑和在线发布而设计。它是AdobeCreativeCloud的一部分,可以与AdobePremierePro和AfterEffects无缝集成。通过AdobeME,用户可以轻松地将视频文件转码为不同格式,调整编......
  • AI编程工具使用技巧——Cursor (思维导图-java架构)
    Cursor是一个AI辅助编程工具,它能够帮助开发者更快地编写代码、理解现有代码库以及解决编程中遇到的问题。当涉及到Java架构时,利用Cursor可以极大地提高开发效率和代码质量。以下是围绕着如何使用Cursor进行Java项目开发的思维导图建议框架:AI编程工具使用技巧-Cursor(Java......
  • Stable Diffusion整合包(sd安装包)免费下载,解压即用,三分钟入门AI绘画!
    StableDiffusion(简称SD)是一款地表最强AI绘图工具(AIGC)之一,StableDiffusion下载后就像PS一样在本地电脑安装后即可使用!SD只需输入提示词,就能通过AI算法迅速生成你想要的图片****。有需要stablediffusion整合包以及提示词插件,可以扫描下方,免费获取安装步骤**步骤一:**......
  • AI大模型-提示工程学习笔记9-生成知识提示
    卷首语:我所知的是我自己非常无知,所以我要不断学习。写给AI入行比较晚的小白们(比如我自己)看的,大神可以直接路过无视了。有一种改进大语言模型(LLM)推理能力的技术:生成知识作为提示的一部分。这种方法由Liu等人(2022)提出,旨在通过让模型先生成相关知识,再将这些知识整合到推理过......