首页 > 其他分享 >大模型的幻觉问题

大模型的幻觉问题

时间:2023-10-25 11:46:08浏览次数:25  
标签:模型 知识 生成 问题 幻觉 数据

一 什么是幻觉问题

大模型的幻觉问题是指大模型生成的答案不基于任何事实数据,简单来说就是杜撰、一本正经的胡说八道。

幻觉问题也是影响大模型落地的重要原因之一

幻觉问题分类

1 和用户输入冲突的幻觉

2 和上下文冲突的幻觉

3 和事实知识冲突的幻觉(目前重点)例如,大模型在生成医疗建议时可能会捏造错误的药品剂量,误导缺少专业医学知识的用户,产生风险。

二 传统幻觉与大模型幻觉

归根结底还是出在数据身上

传统任务单一的,数据质量相对于大模型的海量数据更高,大模型训练使用的海量数据来源于互联网,这部分数据本身就存在部分质量问题,捏造、过时、偏见等内容都会导致幻觉;

大模型是通用模型,应用于多语言、多任务、多领域的通用场景,这对于后处理消除幻觉问题也带来一定难度

大模型生成能力更强,生成的内容具有迷惑性,看上去很合理,需要专业领域知识的人才能识别,一般人很难发现幻觉问题。

三 幻觉问题评估

评估形式:文本生成任务,文本续写、问答、指令实现

评估实现:人工、模型评估(GPT4)、规则评估

四 幻觉问题产生原因

1 训练过程引入,大模型训练的数据中缺失事实数据或者是引入了错误的知识

2 对齐过程引入,主要是指令微调和RLHF,指令微调数据也可能引入错误知识或者引导模型捏造答案,RLHF过程可能导致模型为了迎合人类喜好而编造内容。

3 生成策略引入,不恰当的生成策略会导致模型产生幻觉问题,有些论文提到基于采样的解码方式引入的随机性会导致幻觉问题,自回归的生成方式也会导致幻觉累积,导致幻觉问题

五 如何缓解幻觉问题

1 训练过程入手,增加训练语料的数量,提高训练语料的质量

2 对齐过程入手,微调阶段:高质量的十几万-几十万的数量级的微调数据,避免行为克隆现象,减少指令数据中超过大模型能力的样本,微调过程一味强迫大模型学习这类样本会导致大模型过度自信,对任何问题都以非常肯定的语气进行回复,到实际应用时,大模型就会对不会的答案捏造回复,从而导致幻觉。

        RLHF阶段:openai分享提到一种思路,给不同语气回复的错误以不同的惩罚力度,这样做的目的是鼓励模型表达不确定性、质疑的同时承认错误,从而缓解过度自信带来的幻觉问题,但是这种惩罚力度又不能太大,有报告指出惩罚力度太大会导致模型拒绝回答它本可以回答正确的问题。

3 推理阶段入手,1 改进解码策略,让模型在解码时的注意力关注在事实数据上,从而降低幻觉

                             2 借助外部知识库或知识图谱,模型在解码时,借助知识库检索和用户问题相关的知识,让模型予以参考。

 4 知识编辑  通过直接编辑大模型参数,来改变它蕴含的知识,从而改变其行为,难度较大

标签:模型,知识,生成,问题,幻觉,数据
From: https://www.cnblogs.com/Revelation/p/17785261.html

相关文章

  • CCS问题
      1、解决CCS下注释乱码及“Noruletomaketarget”问题解决CCS下注释乱码及“Noruletomaketarget”问题_ccs注释乱码_比特冬哥的博客-CSDN博客......
  • 关于单独程序可以访问外网 iis和winserver无法访问外网的问题
    在winserver和iis分别部署了一套发送企微的服务,但是报了一个错 通过ping和浏览器确认网没有问题,然后怀疑是不是有权限的问题,因为这两种服务的权限点不一样给Winserver添加管理员权限。解决 在给iis加权限的时候却遇到了问题,给iis加上管理员权限,并没有什么卵用 后......
  • 英国本科留学期间被开除,来吧,跨本申硕解决问题
    英国本科留学期间被开除,来吧,跨本申硕解决问题出勤率太低、GPA太低、考试挂科、补考挂科、论文不过、引用不当、学术不诚信等等因素都是可能导致本科无法顺利毕业的因素。然而,本科无法顺利毕业的留学生回国之后不寻求任何的帮助,将面临的很可能是一无所有。左同学在英国学习生活了近......
  • 减少软件故障、防范黑客,软件质量安全问题不容忽视
    软件质量的重要性毋庸置疑,而对于开发人员来说,软件质量更多反应的是代码的质量。虽然有报告显示代码质量安全的行业现状显示出持续改进的态势。2022年全年,奇安信代码安全实验室对2001个国内企业自主开发的软件项目源代码进行了安全缺陷检测,整体缺陷密度为10.11个/千行,高危缺陷密度为......
  • FastAPI学习-11. 请求body - 嵌套模型
    前言使用 FastAPI,你可以定义、校验、记录文档并使用任意深度嵌套的模型(归功于Pydantic)List字段你可以将一个属性定义为拥有子元素的类型。例如Python list:fromtypingimportUnionfromfastapiimportFastAPIfrompydanticimportBaseModelapp=FastAPI()classIte......
  • pydantic学习与使用-16.ORM 模型 orm_mode
    前言pydantic一般是把传入的键值对,转成pydantic对象.我们希望将一个自定义的类对象,转成pydantic模型,需在Config类中,设置属性orm_mode=True。开启from_orm()方法的使用开启orm_modepydantic的orm模型默认是关闭的,需在Config类中,设置属性orm_mode=True。开启from_orm()方......
  • pytest运行警告问题解决:DeprecationWarning: pkg_resources is deprecated as an API
    前言最近在运行pytest的时候,经常出现这个警告DeprecationWarning:pkg_resourcesisdeprecatedasanAPISeehttps://setuptools.pypa.io/en/latest/pkg_resources.htmlfrompkg_resourcesimportiter_entry_points从警告上看是方法被弃用,肯定是因为新版弃用了旧版的语法。遇......
  • szfpga Lattice高速下载器HW-USBN-2B 常见问题解答
      .产品特点     1).支持windows7,Windows10操作系统,两个操作系统非常稳定不断线。  2).支持JTAG模式,速度快,最高30Mb/s,调试serdescore,不会像hw-usbn-2a出现错误。如这种错误Error:failedtosetcablepor(cable:USBport:EzUSB-0error:-1)  3). ......
  • 大模型训练中CPU与GPU使用率的优化策略
    随着深度学习和人工智能的快速发展,训练模型的需求不断增加。然而,在实践中,我们经常遇到一个令人困扰的问题:当训练模型时,CPU经常达到100%的使用率,但GPU使用率却仅仅维持在5%左右。这种不均衡的使用情况导致了训练过程的缓慢,甚至可能影响模型的准确性。在了解这个问题之前,我们需要先了......
  • 《面试1v1》JVM内存模型
    我是javapub,一名Markdown程序员从......