首页 > 其他分享 >A 12nm 121-TOPS/W 41.6-TOPS/mm2 All Digital Full Precision SRAM-based Compute-in-Memory with Configu

A 12nm 121-TOPS/W 41.6-TOPS/mm2 All Digital Full Precision SRAM-based Compute-in-Memory with Configu

时间：2024-08-21 09:37:35浏览次数：16

标签：Full based 乘法器 TOPS 加法器 LUT 4b 或非门

1b*4b的操作是通过4b或非门乘法器完成，然后再通过4b加法器两两相加。但是从真值表上来看，2个4b或非门乘法器加1个4b加法器完成的工作实际上可以通过一个由加法器和两比特IN控制的四选一Mux（或者说LUT）来完成。这样做的话可以直接节省掉21%的功耗。

提出的这个并行多位输入结构下（即并非bit serial的输入4b数，而是并行的把4个4b输入给送进去，从而提升吞吐率），由于要1cycle算完4个4b和4个4b的乘累加，所以电路复制了四套。由于在LUT方案下可以加法器可以share，可以share的原因是激活值的不同数位乘以的是相同的4bit权重。不像原来的方案那样加法器也要做复制，尽管在1b-input情况下LUT方案会比原来的方案Macro Size大出7%（Mux比或非门乘法器大导致的），但是在并行多位输入的4b-input的情况下，Macro Size反而会减小，比原方案少16%的面积。

time-stealing技术

标签：Full,based,乘法器,TOPS,加法器,LUT,4b,或非门
From： https://www.cnblogs.com/sunflowermi/p/18370882

相关文章

A 4nm 6163-TOPS/W/b 4790-TOPS/mm2/b SRAM Based Digital-Computing-in-Memory Macro
SRAMarray和Localadder耦合在一起形成一个块，两个块share一个semi-global-adder，四个块再去shareGlobaladder和移位累加器。这样的floorplan使得整体结构上不存在一大块独立的巨型多级加法树，使得布局变得更加的规整。这里讨论了mix-Vt设计的问题，即混用高Vt管子和低Vt管子，高Vt......
An 89TOPS/W and 16.3TOPS/mm2 All-Digital SRAM-Based Full-Precision Compute-In Me
权重是4bit的CIM结构图：激活值是4bit的做法是：以MSB-first的方式串性送入，然后通过移位加计算不同数位的和累加器就是一个移位累加结构，其中具有对符号位的处理机制，这里是补码机制。如果符号位是0，直接原码做符号位拓展加进去，如果符号位是1，取反加1原码转成补码之后加进去。减少......
EOFException com.mysql.cj.protocol.FullReadInputStream in readFully
背景：mysql查询性能瓶颈，一般前提有很多查询超时导致这个问题java.io.EOFException:Cannotreadresponsefromserver.Expectedtoread4bytes,read0bytesbeforeconnectionwasunexpectedlylost.atcom.mysql.cj.protocol.FullReadInputStream.readFully(FullRe......
failed to solve: process “/bin/sh -c yum -y install vim“ did not complete succ
网上有好多种方法（都试过了只有方法四可以用）：方法一：systemctl restart docker（生产上不建议）方法二：看看你的网络是否有问题，检查一下网络连通性方法三：有可能是容器版本的问题，推荐使用centos7，看网上说最新的镜像会有这类的的问题方法四：就像这个博主大佬说的修改主机源修改......
【公式推导】Elucidating the Design Space of Diffusion-Based Generative Models 【
ElucidatingtheDesignSpaceofDiffusion-BasedGenerativeModels论文精读关注B站可以观看更多实战教学视频：hallo128的个人空间【更新中】EDM论文精读论文链接（1）论文：ElucidatingtheDesignSpaceofDiffusion-BasedGenerativeModels（2）引用：KarrasT,Aittala......
京粉智能推广助手-LLM based Agent在联盟广告中的应用与落地
一、前言拥有一个帮你躺着赚钱的助手，听起来是不是有点心动？依托于京东联盟广告平台，借助AIGC大语言模型出色的理解、推理、规划能力，我们推出了京粉智能推广助手机器人，帮助合作伙伴拥有自己的智能助理，为京东联盟的推客提供更加智能的一站式经营服务。1、京东联盟是什么？《京东联盟......
[论文阅读]Mobility-Aware Cooperative Caching in VEC Based on CAFR
论文：Mobility-AwareCooperativeCachinginVehicularEdgeComputingBasedonAsynchronousFederatedandDRLJSTSP2022基于异步联邦和深度强化学习的车载边缘计算移动感知协同缓存一、Introductionbackground：随着车联网（IoV）和云计算（CloudComputing）的发展，缓存技术......
多模态学习之论文阅读：《Multi-modal global- and local- feature interaction with at
《Multi-modalglobal-andlocal-featureinteractionwithattention-basedmechanismfordiagnosisofAlzheimer’sdisease》-2024.9本文提出了一种新的多模态学习框架，用于提高阿尔茨海默病（Alzheimer'sdisease,AD）的诊断准确性。该框架旨在通过结合临床表格数据和大脑......
MySQL this is incompatible with sql_mode=only_full_group_by-错误解决
mysql执行groupby时遇到下面提示：SELECTlistisnotinGROUPBYclauseandcontainsnonaggregatedcolumn'crm.b.id'whichisnotfunctionallydependentoncolumnsinGROUPBYclause;thisisincompatiblewithsql_mode=only_full_group_by原因：在sql执行时，出现该原......
001topsolid软件操作工具漏孔漏槽解决方案
使用topsolid软件拆单经常会遇到漏孔漏槽问题，在设备加工试装后被试装师傅数落不知多少次！老话说吃一堑长一智，明明已点操作工具，但还是防不胜防，甚是头疼。总结如下原因：1、调入标准件时，最后一步未点击操作工具;2、在修改模型过程中，操作工具偶尔失效，软件自身bug;......

赞助商

阅读排行