本文是LLM系列文章,针对《RT-Surv: Improving Mortality Prediction After Radiotherapy with Large Language Model Structuring of Large-Scale Unstructured Electronic Health Records》的翻译。
RT-Surv:通过大规模非结构化电子健康记录的大型语言模型结构改进放疗后死亡率预测
摘要
背景: 准确的患者选择对于防止无效的放疗 (RT) 治疗至关重要。依赖于结构化数据的传统生存预测模型通常缺乏精度。大型语言模型 (LLM) 为构建非结构化电子健康记录 (EHR) 数据提供了一种新颖的方法,通过整合全面的临床信息,有可能改善生存预测。
方法: 我们分析了 2013 年至 2023 年间延世癌症中心接受 RT 治疗的 34,276 名患者的结构化和非结构化数据。开源 LLM 使用单次学习构建了非结构化 EHR 数据。外部验证涉及 2020 年 3 月至 2023 年 7 月在龙仁世福兰斯医院接受 RT 治疗的 852 名患者。将 LLM 的性能与特定领域的医学 LLM 和更小变体的性能进行了比较。 使用统计、机器学习和深度学习方法开发的生存预测模型结合了结构化和 LLM 结构化数据。
**结果:**开源 LLM 在构建非结构化 EHR 数据方面实现了 87·5% 的平均准确率,而无需额外的训练。特定领域的医学 LLM 表现明显更差,