本文是LLM系列文章,针对《CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multilabel Social Media Text Classification in Disaster Informatics》的翻译。
CrisisSense-LLM:灾难信息学中多标签社交媒体文本分类的指令微调大语言模型
摘要
在危机/灾害信息学领域,社交媒体正越来越多地用于提高态势感知,为应对和救援工作提供信息。高效准确的文本分类工具一直是危机信息学研究的重点领域。然而,目前的方法大多依赖于单标签文本分类模型,无法捕捉到动态和多方面的灾害相关社交媒体数据中嵌入的不同见解。本研究介绍了一种新的灾难文本分类方法,通过针对灾难相关推文的多标签分类进行指令微调来增强预训练的大型语言模型(LLM)。我们的方法涉及从与灾难相关的推文中创建一个全面的指令数据集,然后使用该数据集对开源LLM进行微调,从而将其嵌入特定于灾难的知识中。这种微调模型可以同时对灾害相关信息的多个方面进行分类,如事件类型、信息含量和人类援助的参与程度,显著提高了社交媒体数据在灾害情境感知中的效用。结果表明,这种方法增强了社交媒体帖子中关键信息的分类,从而有助于在紧急情况下更有效地部署态势感知。这项研究为更先进、适应性更强、更稳健的灾害管理工具铺平了道路,利用LLM的能力来提高灾害场景中的实时态势感知和响应策略。