首页 > 其他分享 >You Only Cache Once:YOCO 基于Decoder-Decoder 的一个新的大语言模型架构

You Only Cache Once:YOCO 基于Decoder-Decoder 的一个新的大语言模型架构

时间:2024-05-12 11:42:51浏览次数:29  
标签:缓存 架构 YOCO Cache 解码器 KV Decoder

这是微软再5月刚刚发布的一篇论文提出了一种解码器-解码器架构YOCO,因为只缓存一次KV对,所以可以大量的节省内存。

以前的模型都是通过缓存先前计算的键/值向量,可以在当前生成步骤中重用它们。键值(KV)缓存避免了对每个词元再次编码的过程,这样可以大大提高了推理速度。

但是随着词元数量的增加,KV缓存占用了大量GPU内存,使得大型语言模型的推理受到内存限制。所以论文的作者改进了这一架构:

YOCO是为自回归建模而设计的,例如大型语言模型(llm)。所提出的解码器-解码器架构有两部分,即自解码器和交叉解码器,如下图所示

 

https://avoid.overfit.cn/post/90e0bd170644476cbccabb039e7105ae

标签:缓存,架构,YOCO,Cache,解码器,KV,Decoder
From: https://www.cnblogs.com/deephub/p/18187624

相关文章

  • 小程序无法使用TextEncoderDecoder问题
    不知道为什么用网友给的FastestSmallestTextEncoderDecoder这个在小程序一直引入不到里面的方法找网友要了两个js包就能用https://github.com/123456789xzxz/miniprogram/blob/main/miniprogram-text-decoder.jshttps://github.com/123456789xzxz/miniprogram/blob/main/minipr......
  • 如何将cache info透传入qemu虚拟机
    将cache信息透传如虚拟机有助于guestkernel更好的进行负载均衡,甚至于减少IPI中断【1】。使用qemu命令行:qemu-system-x86_64\-cpuhost,host-cache-info=on,topoext\使用libvirt,virt-installvirt-install\--cpumode='host-passthrough',cache.mode='passthrough'......
  • .NET 缓存:内存缓存 IMemoryCache、分布式缓存 IDistributedCache(Redis)
    .NET缓存:内存缓存IMemoryCache、分布式缓存IDistributedCache(Redis)  .NET缓存里分了几类,主要学习内存缓存、分布式缓存一、内存缓存IMemoryCache1、Program注入缓存builder.Services.AddMemoryCache();2、相关方法及参数Get、TryGetValue、GetOrCreate、GetOrCrea......
  • 服务端缓存页面及IIS缓存设置:iis cache-control设定
    IIS是一个Web服务器软件,可以通过设置Cache-Control标头来控制浏览器或其他客户端如何缓存Web页面或资源。Cache-Control是HTTP协议中的一个响应头,它指示客户端在何种程度上缓存与重新获取资源。Cache-Control标头可用于控制客户端缓存的行为,例如缓存过期时间、是否强制重新验证缓......
  • [转帖]深入JVM - Code Cache内存池
    https://juejin.cn/post/6985913007142354958 1.本文内容本文简要介绍JVM的CodeCache(本地代码缓存池)。2.CodeCache简要介绍简单来说,JVM会将字节码编译为本地机器码,并使用CodeCache来保存。每一个可执行的本地代码块,称为一个nmethod。nmethod可能对应一个......
  • nginx cache test.md
    NginxCache简要配置#使用CentOS7作为基础镜像FROMcentos:7#安装依赖RUNyum-yupdate&&\yum-yinstallepel-release&&\yum-yinstallgccgcc-c++makezlib-develpcre-developenssl-devel#下载Nginx和ngx_cache_purge模块RUNcurl-O......
  • LruCache源码解析
    最近被问到LruCache原理一直觉得很简单的东西猛然一想,卧槽忘了,赶紧翻开源码瞧瞧!1、首先构造lrucache的时候会新建一个linkedHashMap来作为存储容器publicLruCache(intmaxSize){if(maxSize<=0){thrownewIllegalArgumentException("maxSize<=......
  • yum安装mysql报错--您可以尝试添加 --skip-broken 选项来解决该问题 清除缓存命令
    yum安装mysql报错--您可以尝试添加--skip-broken选项来解决该问题    安装mysql时,如果安装报错,首先删除缓存,    1、清除缓存  yumcleancache    2、重新加载  yummakecache    3、重新安装  yuminstallmysql    此......
  • python修改pip的cache默认文件夹
    之前一直没管,默认会在c盘,越来越大修改pip.ini之前写过一篇关于pip.ini的文章https://www.cnblogs.com/qcy-blog/p/17789058.htmlcache文件夹要存在[global]cache-dir=D:\pip\cache查看是否更改成功pipcachedir......
  • Intel Pentium III CPU(Coppermine, Tualatin) L2 Cache Latency, Hardware Prefetch
    这几天,偶然的机会想到了困扰自己和其他网友多年的IntelPentiumIII系列处理器缓存延迟(L2CacheLatency),以及图拉丁核心版本是否支持硬件预取(HardwarePrefetch)问题。手头的支持图拉丁核心处理器的i815主板还在正常服役中,铜矿和图拉丁核心处理器也都有,所以就专门做了这一期调查,感......