首页 > 其他分享 >System 2 Attention:可以提高不同LLM问题的推理能力

System 2 Attention:可以提高不同LLM问题的推理能力

时间:2023-12-10 10:45:13浏览次数:33  
标签:思考 模型 Attention 系统 System LLM llm 推理

推理正在成为大型语言模型(llm)关注的下一个主要领域。尽管llm拥有先进的能力,但大多数llm经常被简单的错误绊倒,显示出他们在推理方面的局限性。这些模型可能会被上下文中的不相关细节所误导,或者受到输入提示中的偏差的影响。而后一种倾向被称为谄媚,也就是说模型会更偏向与输入一致,而不管准确性如何。人们已经做出了各种努力来解决这些缺点,包括增加监督训练数据或应用强化学习方法。在最近的一项研究中,Meta AI认为问题的根源在于这些模型中使用的transformer 架构的基本设计,特别是注意力机制。这项研究的灵感来自丹尼尔·卡尼曼和阿莫斯·特沃斯基对行为心理学的研究,这些研究在《Thinking Fast and Slow》一书中得到了精彩的阐述。

  1. 系统1(System 1): 这是一种快速、直觉性、自动的思考方式。它是我们在处理日常事务时采用的那种直觉反应,几乎是无意识的。系统1负责快速做出决策,识别模式,感知情绪等。然而,它有时候可能会导致错误,因为它更容易受到情感和直觉的影响。
  2. 系统2(System 2): 这是一种更为缓慢、深思熟虑、理性的思考方式。当我们面临更复杂、挑战性的问题时,系统2被激活。这种思考方式需要更多的认知努力,包括逻辑分析、推理和意识层面的思考。系统2更能够进行深度思考,但也更耗费时间和精力。

https://avoid.overfit.cn/post/4d6dae0510b44b779668dc4ab51108e9

标签:思考,模型,Attention,系统,System,LLM,llm,推理
From: https://www.cnblogs.com/deephub/p/17892248.html

相关文章

  • pycharm中三种解释器:virtual Enviroment、conda Enviroment、system interpreter
    1、systeminterpreter不推荐使用2、VirtualEnvironment—Python的虚拟环境可以使一个Python程序拥有独立的库library和解释器interpreter,而不用与其他Python程序共享统一个library和interpreter。虚拟环境的好处是避免了不同Python程序间的互相影响(共同使用globallibrary和i......
  • 如何解决yum安装软件时报错This system is not registered with an entitlement serve
    RedHat、基于redhat源代码所编译的centos都会遇到这种问题,红帽需要对当前的系统进行注册后才能使用yum安装软件,解决方法多种多样,如直接注册+订阅/换yum源/干掉RedHatSubscriptionManager订阅管理器解决方法:这里介绍最简单的一种:禁用RedHatSubscriptionManager订阅管理......
  • Predicting gene expression from histone modifications with self-attention based
    Predictinggeneexpressionfromhistonemodificationswithself-attentionbasedneuralnetworksandtransferlearningYuchiChen 1, MinzhuXie 1, JieWen 1Affiliations expandPMID: 36588793 PMCID: PMC9797047 DOI: 10.3389/fgene.2022.1081......
  • ubuntu 使用systemd systmctl配置服务开机启动,服务包含多个子进程
    背景:需求是这样的,有一个服务,有6个子进程,每次系统重启都要一个一个启动,很繁琐,需要配置到开机启动里而目前系统已经抛弃了chkconfig的配置方式,转而使用systemd来配置开机启动进程了所以需求就变成了把服务配置到systemd开机启动中,服务包含6个子进程配置这个踩了不少坑,特地记录下......
  • SystemWeaver—电子电气系统协同研发平台
    背景概述    当前电子电气系统在汽车领域应用广泛,其设计整合了多门工程学科,也因系统的复杂性、关联性日益提升,需要其提供面向软件、硬件、网络、电气等多领域交织而导致的复杂系统解决方案。并且随着功能安全、AUTOSAR、SOA、以太网通讯等新要求、方法、概念及技术的提出,......
  • System.Diagnostics.Process.Start 用法
    原文链接:https://blog.csdn.net/polloo2012/article/details/82110642System.Diagnostics.Process.Start();能做什么呢?它主要有以下几个功能:1、打开某个链接网址(弹窗)。2、定位打开某个文件目录。3、打开系统特殊文件夹,如“控制面板”等。那么它是怎么实现这几个功能的呢?在讲......
  • 语言大模型(LLMs)的特点
    语言大模型(LargeLanguageModels,LLMs)是近年来自然语言处理领域的重要发展之一。其主要特点是:海量参数:LLMs包含了上十亿个参数,特别是GPT-3包含了1759亿个参数。这些大规模的参数使其可以学习非常复杂的模式和表征。巨量数据集:LLMs通过海量数据进行预训练,例如GPT-3使......
  • Systemd 入门教程:实战篇
    一、开机启动对于那些支持Systemd的软件,安装的时候,会自动在/usr/lib/systemd/system目录添加一个配置文件。如果你想让该软件开机启动,就执行下面的命令(以httpd.service为例)。$sudosystemctlenablehttpd上面的命令相当于在/etc/systemd/system目录添加一个符号链接,指......
  • Systemd 入门教程:命令篇
    Systemd是Linux系统工具,用来启动守护进程,已成为大多数发行版的标准配置。本文介绍它的基本用法,分为上下两篇。今天介绍它的主要命令,下一篇介绍如何用于实战。一、由来历史上,Linux的启动一直采用init进程。下面的命令用来启动服务。$sudo/etc/init.d/apache2start#......
  • 如何优雅的使用 Systemd 管理服务
    背景:我们在构建Kubernetes容器化平台时,会在节点上部署各种agent,虽然容器化当道的今天很多程序可以直接采用docker方式进行运行,但我们在整个集群内部仍然大量使用了 systemd 来管理基础服务。不过在使用过程中发现可能出现相关依赖的服务组件异常后导致节点上服务不可用......