本文是LLM系列文章,针对《Enhancing Question Answering for Enterprise Knowledge Bases using Large Language Models》的翻译。
使用大型语言模型增强企业知识库的问答能力
摘要
高效的知识管理在提高企业和组织的运营效率和创新能力方面发挥着关键作用。通过矢量化对知识进行索引,出现了各种知识检索方法,显著提高了知识管理系统的效率。最近,生成性自然语言处理技术的快速发展为在检索针对用户查询量身定制的相关文档后生成精确和连贯的答案铺平了道路。然而,对于企业知识库来说,由于私人数据的隐私和安全政策,从头开始组装大量的训练数据用于知识检索和生成是一项艰巨的挑战,这通常会带来巨大的成本。为了应对上述挑战,在本文中,我们提出了EKRG,这是一种基于大型语言模型(LLM)的新型检索生成框架,专门设计用于以有限的注释成本为企业知识库进行问答。具体来说,对于检索过程,我们首先介绍了一种使用LLM的指令调优方法,以生成足够的文档问题对来训练知识检索器。这种方法通过精心设计的指令,有效地为企业知识库生成各种问题,包括面向事实和面向解决方案的知识。此外,我们开发了一种具有相关性意识的师生学习策略,以进一步提高训练过程的效率。对于生成过程,我们提出了一种新的基于思想链(CoT)的微调方法,使基于LLM的生成器能够使用检索到的文档熟练地响应用户问题。最后,对真实世界数据集的广泛实验证明了我们提出的框架的有效性。