首页 > 其他分享 >人工智能应用-知识问答

人工智能应用-知识问答

时间:2024-06-12 21:32:39浏览次数:9  
标签:方案 FAQ 答案 人工智能 知识 LLM 文本 问答

文章目录

垂直领域知识问答的特点

1、问答内容通常不存在通用语料
2、回答内容对准确率要求较高,召回率要求相对较低。
3、扩展性和可控性(可以根据需求,增、删、改特定问题的回答内容,或以特定形式进行回复处理,如进入剧本、非文本回复等)。
4、需要确切的评价方式

知识问答的实现方案

知识库+文本匹配(传统方案)

在这里插入图片描述
该方案实现流程,包括如下几个关键步骤:
1、构建FAQ库(frequently asked questions)
FAQ库,也叫做知识库,包含针对特定主题或领域的一系列最常见问题及答案。这些答案通常是由领域专家、客服团队或知识管理专业人员预先编写和整理。
一个典型的FAQ库可能包含以下特点:
结构化问题列表:问题被组织成列表,便于知识管理员进行浏览和维护。
简洁明了的答案:每个问题旁边都有相应的答案,这些答案简洁、准确,易于理解。
搜索功能:用户可以通过关键词搜索找到相关问题的答案。
更新和维护:FAQ库需要定期更新,以包含最新的信息和常见问题。
用户交互:一些FAQ库允许用户对答案进行评分,或者提供反馈,帮助改进FAQ库的质量。

如下为一个FAQ库的原型页面
在这里插入图片描述
2、用户问题与FAQ主问题相似度模型训练
相似度计算方式目前较为常用的是基于神经网络的文本转向量,用向量相似度代表文本相似度。

直接生成(基于LLM的方案)

在这里插入图片描述
此种方案,需要使用事先准备的QA数据,对LLM进行fine-tune,其缺点如下:
1.fine-tune的困难(算力需求、数据需求)
2.fine-tune带来的模型泛用性下降或消失
3.生成答案不完全可控(不正常回复 bad 误导性回复 worse)
4.不易调整(增加一条新知识、撤掉某条旧知识、某条知识答案要修改)
5.不易评价效果(所有字正确?大部分字正确?)

RAG(基于LLM的方案)

RAG的核心功能,可以理解为段落召回+阅读理解的方式,其流程如下:
在这里插入图片描述
在此方案中:
1、在根据用户问题进行查找,召回匹配的文本片段时,不必完全依赖向量化以及向量数据库,使用传统搜索引擎也是一种召回的可选方案。
2、随着LLM能力的增强,可以接受的prompt长度越来越长(claude-100k等),对于文本切分成段落进行存储及查找召回的要求会越来越低,后期文本内容可以完整的放到数据库中及发给大模型的输入中。
3、只要LLM的能力够强,不做fine-tune也能直接完成这个流程

缺点:
1.对基础LLM的能力要求比较高
2.受召回算法限制,如果召回时正确答案已经被舍弃,LLM无法挽回
3.生成结果不完全可控,包括回答的语气,行文方式等等。

基于知识体系(基于LLM的方案)

在这里插入图片描述
在这种方案中,有如下关键步骤:
1、构建如上图的知识体系,叶节点是目标答案。
2、当用户查询时,循环调用大模型,从顶级分支开始进行分支判断,最终确认目标叶子结点。大模型提示语格式如下:
prompt = “”“你是一个保险公司问答机器人,请根据用户输入的问题,判断该问题属于下列的哪类问题,输出类别序号:
1.个人保单业务相关问题
2.金管家操作问题
3.保险相关名词解释问题
用户问题:
{question}”“”

注:
1、类似做法可以参考 ceval 清华评测LLM能力项目 https://github.com/SJTU-LIT/ceval
2、因为大模型的响应速度较慢,在第二层级、第三层级的判断上,不一定要使用大模型。可以“大带小”提升预测效率

各类方案对比

在这里插入图片描述

标签:方案,FAQ,答案,人工智能,知识,LLM,文本,问答
From: https://blog.csdn.net/tdzhqxy/article/details/131629370

相关文章

  • Python学习笔记6:pychram相关知识及安装教程,后续需要学习的入门知识
    上篇文章说了,今天去公司重新装一下IDE,最后也是把过程这边再记录一下,有需要的可以参考一下。关于pychrampychram是什么?PyCharm是由JetBrains公司开发的一款流行的Python集成开发环境(IDE)。它专为Python语言设计,提供了许多方便的功能来帮助开发者编写、测试和调试Python代码......
  • 【java问答小知识8】一些Java基础的知识,用于想学习Java的小伙伴们建立一些简单的认知
    Java中的"java.util.IdentityHashMap"如何比较键?回答:"java.util.IdentityHashMap"使用==操作符来比较键,即它比较的是引用身份。Java中的"java.util.EventListener"接口有什么作用?回答:"java.util.EventListener"接口是所有事件监听器接口的基接口,用于定义事件处理方法......
  • 零基础非科班也能掌握的C语言知识21 编译链接(介于作者实力有限并且没有可以演示的过程
    编译链接1.翻译环境和运行环境2.翻译环境2.1编译2.1.1预处理(预编译)2.1.2编译2.1.3汇编2.2链接3.运行环境1.翻译环境和运行环境在ANSIC的任何⼀种实现中,存在两个不同的环境。编译环境运行环境2.翻译环境翻译环境由编译和链接两个大的过程组成的,而编译又可......
  • 人工智能的历史、现状与未来展望
    一、引言人工智能(AI)作为当今科技领域的热门话题,已经深入到了我们生活的方方面面。从智能家居到自动驾驶,从医疗诊断到金融分析,AI的应用正在不断拓展。本文将带您回顾人工智能的历史,分析当前的发展现状,并展望未来的发展趋势。二、人工智能的历史起源与早期发展人工智能的概念......
  • 基础网络知识
    ip地址:IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。分为公有IP地址和私有IP地址,是一个32位的二进制数,通常用点分十进制表示。公有IP地址:公网IP在全世界只有一个,通过它直接访问因特网私网IP地址:专门为组织机......
  • Apple Intelligence 带来的十大影响:人工智能的iPhone时刻到来
    引言在最近的WWDC大会上,Apple发布了全新的AppleIntelligence,引起了全球的广泛关注。这次发布被誉为“人工智能的iPhone时刻”,标志着我们每个人都将拥有第一个AI助理,并将引领AIAgent进入红海时代。本文将详细分析AppleIntelligence的十大影响,探讨其如何改变我们的生活和......
  • 12款高效开源Wiki系统推荐,打造团队知识管理利器
    文章介绍了12款好用的开源Wiki:PingCode、DokuWiki、MediaWiki、TikiWikiCMSGroupware、XWiki、BookStack、PMWiki、Foswiki、GitBook、Wiki.js、TiddlyWiki、Slite。以及对比了一款非开源但提供免费版本的Wiki工具,以供大家选择。在企业知识管理和团队协作中,Wiki系统因其强......
  • git 相关知识
    .gitignore忽略文件/文件夹忽略文件如果是忽略某个目录下的某个文件:/test/text.txt或者test/text.txt如果是忽略根目录下的text.txt文件:/text.txt如果是忽略所有的text.txt文件:text.txt忽略文件夹要忽略整个文件夹以及其下面的内容(文件夹名称+/):text/如果只写了text:会......
  • windows server 2019 操作步骤和知识点(第一节)
    windowsserver1.1vmwareworkstation作用模拟硬件模拟操作系统步骤安装1模拟硬件文件新建虚拟机典型稍后安装操作系统Mcirosoftwindowswindows10X64win10-1d:/xujiji/win10-12模拟操作系统CD\DVD(SATA)使用ISO映像文件d:\iso\win10..........
  • AIGC绘画设计:深入浅出完整解析Stable Diffusion(SD)核心基础知识
    心血来潮再加上想要督促自己,所以决定开始搞AI绘画技术的分享。如果觉得我写的好,又很久没更新,请多点我,因为可能我的懒癌又犯了,哈哈哈哈哈......没有本人帅,十分之一都没有不多废话,切入主题。学一门技术什么最难?当然是入门最难!从0到1,远远比从1到100要难一百倍,为啥?因为你之前......