权重是4bit的CIM结构图:
激活值是4bit的做法是:
以MSB-first的方式串性送入,
然后通过移位加计算不同数位的和
累加器就是一个移位累加结构,其中具有对符号位的处理机制,这里是补码机制。如果符号位是0,直接原码做符号位拓展加进去,如果符号位是1,取反加1原码转成补码之后加进去。
减少功耗使用了DVS(dynamic voltage)技术,Weight update时使用VDD电压,MAC时使用低于VDD的电压。
在Adder Tree中使用了两种不同的Full Adder,14T和28T,来实现节省能耗。基于静态逻辑门的28T加法器具有传统的上拉下拉CMOS结构,能够提供全摆幅输出和良好的驱动能力,14T加法器则具有更少的晶体管数量,更小的面积,更低的功耗和延迟。在TSMC这篇的Adder Tree中选择了将两类加法器交替使用。