人工智能应用-知识问答

时间：2024-06-12 21:32:39浏览次数：20

标签：方案 FAQ 答案人工智能知识 LLM 文本问答

文章目录

垂直领域知识问答的特点
知识问答的实现方案
各类方案对比

垂直领域知识问答的特点

1、问答内容通常不存在通用语料
2、回答内容对准确率要求较高，召回率要求相对较低。
3、扩展性和可控性（可以根据需求，增、删、改特定问题的回答内容，或以特定形式进行回复处理，如进入剧本、非文本回复等）。
4、需要确切的评价方式

知识问答的实现方案

知识库+文本匹配（传统方案）

在这里插入图片描述
该方案实现流程，包括如下几个关键步骤：
1、构建FAQ库(frequently asked questions）
FAQ库，也叫做知识库，包含针对特定主题或领域的一系列最常见问题及答案。这些答案通常是由领域专家、客服团队或知识管理专业人员预先编写和整理。
一个典型的FAQ库可能包含以下特点：
结构化问题列表：问题被组织成列表，便于知识管理员进行浏览和维护。
简洁明了的答案：每个问题旁边都有相应的答案，这些答案简洁、准确，易于理解。
搜索功能：用户可以通过关键词搜索找到相关问题的答案。
更新和维护：FAQ库需要定期更新，以包含最新的信息和常见问题。
用户交互：一些FAQ库允许用户对答案进行评分，或者提供反馈，帮助改进FAQ库的质量。

如下为一个FAQ库的原型页面
在这里插入图片描述
2、用户问题与FAQ主问题相似度模型训练
相似度计算方式目前较为常用的是基于神经网络的文本转向量，用向量相似度代表文本相似度。

直接生成（基于LLM的方案）

在这里插入图片描述
此种方案，需要使用事先准备的QA数据，对LLM进行fine-tune，其缺点如下：
1.fine-tune的困难（算力需求、数据需求）
2.fine-tune带来的模型泛用性下降或消失
3.生成答案不完全可控（不正常回复 bad 误导性回复 worse）
4.不易调整（增加一条新知识、撤掉某条旧知识、某条知识答案要修改）
5.不易评价效果（所有字正确？大部分字正确？）

RAG（基于LLM的方案）

RAG的核心功能，可以理解为段落召回+阅读理解的方式，其流程如下：
在这里插入图片描述
在此方案中：
1、在根据用户问题进行查找，召回匹配的文本片段时，不必完全依赖向量化以及向量数据库，使用传统搜索引擎也是一种召回的可选方案。
2、随着LLM能力的增强，可以接受的prompt长度越来越长（claude-100k等），对于文本切分成段落进行存储及查找召回的要求会越来越低，后期文本内容可以完整的放到数据库中及发给大模型的输入中。
3、只要LLM的能力够强，不做fine-tune也能直接完成这个流程

缺点：
1.对基础LLM的能力要求比较高
2.受召回算法限制，如果召回时正确答案已经被舍弃，LLM无法挽回
3.生成结果不完全可控，包括回答的语气，行文方式等等。

基于知识体系（基于LLM的方案）

在这里插入图片描述
在这种方案中，有如下关键步骤：
1、构建如上图的知识体系，叶节点是目标答案。
2、当用户查询时，循环调用大模型，从顶级分支开始进行分支判断，最终确认目标叶子结点。大模型提示语格式如下：
prompt = “”“你是一个保险公司问答机器人，请根据用户输入的问题，判断该问题属于下列的哪类问题，输出类别序号：
1.个人保单业务相关问题
2.金管家操作问题
3.保险相关名词解释问题
用户问题：
{question}”“”

注：
1、类似做法可以参考 ceval 清华评测LLM能力项目 https://github.com/SJTU-LIT/ceval
2、因为大模型的响应速度较慢，在第二层级、第三层级的判断上，不一定要使用大模型。可以“大带小”提升预测效率

各类方案对比

在这里插入图片描述

标签：方案,FAQ,答案,人工智能,知识,LLM,文本,问答
From： https://blog.csdn.net/tdzhqxy/article/details/131629370

Python学习笔记6：pychram相关知识及安装教程，后续需要学习的入门知识
上篇文章说了，今天去公司重新装一下IDE，最后也是把过程这边再记录一下，有需要的可以参考一下。关于pychrampychram是什么？PyCharm是由JetBrains公司开发的一款流行的Python集成开发环境（IDE）。它专为Python语言设计，提供了许多方便的功能来帮助开发者编写、测试和调试Python代码......
【java问答小知识8】一些Java基础的知识，用于想学习Java的小伙伴们建立一些简单的认知
Java中的"java.util.IdentityHashMap"如何比较键？回答："java.util.IdentityHashMap"使用==操作符来比较键，即它比较的是引用身份。Java中的"java.util.EventListener"接口有什么作用？回答："java.util.EventListener"接口是所有事件监听器接口的基接口，用于定义事件处理方法......
零基础非科班也能掌握的C语言知识21 编译链接（介于作者实力有限并且没有可以演示的过程
编译链接1.翻译环境和运行环境2.翻译环境2.1编译2.1.1预处理（预编译）2.1.2编译2.1.3汇编2.2链接3.运行环境1.翻译环境和运行环境在ANSIC的任何⼀种实现中，存在两个不同的环境。编译环境运行环境2.翻译环境翻译环境由编译和链接两个大的过程组成的，而编译又可......
人工智能的历史、现状与未来展望
一、引言人工智能（AI）作为当今科技领域的热门话题，已经深入到了我们生活的方方面面。从智能家居到自动驾驶，从医疗诊断到金融分析，AI的应用正在不断拓展。本文将带您回顾人工智能的历史，分析当前的发展现状，并展望未来的发展趋势。二、人工智能的历史起源与早期发展人工智能的概念......
基础网络知识
ip地址：IP协议提供的一种统一的地址格式，它为互联网上的每一个网络和每一台主机分配一个逻辑地址，以此来屏蔽物理地址的差异。分为公有IP地址和私有IP地址，是一个32位的二进制数，通常用点分十进制表示。公有IP地址：公网IP在全世界只有一个，通过它直接访问因特网私网IP地址：专门为组织机......
Apple Intelligence 带来的十大影响：人工智能的iPhone时刻到来
引言在最近的WWDC大会上，Apple发布了全新的AppleIntelligence，引起了全球的广泛关注。这次发布被誉为“人工智能的iPhone时刻”，标志着我们每个人都将拥有第一个AI助理，并将引领AIAgent进入红海时代。本文将详细分析AppleIntelligence的十大影响，探讨其如何改变我们的生活和......
12款高效开源Wiki系统推荐，打造团队知识管理利器
文章介绍了12款好用的开源Wiki：PingCode、DokuWiki、MediaWiki、TikiWikiCMSGroupware、XWiki、BookStack、PMWiki、Foswiki、GitBook、Wiki.js、TiddlyWiki、Slite。以及对比了一款非开源但提供免费版本的Wiki工具，以供大家选择。在企业知识管理和团队协作中，Wiki系统因其强......
git 相关知识
.gitignore忽略文件/文件夹忽略文件如果是忽略某个目录下的某个文件：/test/text.txt或者test/text.txt如果是忽略根目录下的text.txt文件：/text.txt如果是忽略所有的text.txt文件：text.txt忽略文件夹要忽略整个文件夹以及其下面的内容（文件夹名称+/）：text/如果只写了text：会......
windows server 2019 操作步骤和知识点（第一节）
windowsserver1.1vmwareworkstation作用模拟硬件模拟操作系统步骤安装1模拟硬件文件新建虚拟机典型稍后安装操作系统Mcirosoftwindowswindows10X64win10-1d:/xujiji/win10-12模拟操作系统CD\DVD(SATA)使用ISO映像文件d:\iso\win10..........
AIGC绘画设计：深入浅出完整解析Stable Diffusion（SD）核心基础知识
心血来潮再加上想要督促自己，所以决定开始搞AI绘画技术的分享。如果觉得我写的好，又很久没更新，请多点我，因为可能我的懒癌又犯了，哈哈哈哈哈......没有本人帅，十分之一都没有不多废话，切入主题。学一门技术什么最难？当然是入门最难！从0到1，远远比从1到100要难一百倍，为啥？因为你之前......