近似计算Survey阅读笔记
指标
错误率:error rate(ER)
错误距离:error distance(ED)
归一化平均错误举例:normalized mean error distance(NMED)
平均相对错误距离:mean relative error distance(MRED)
平均错误:average error
以上是衡量近似计算结构的错误特性的指标,与最后计算结果的accuracy有关。
关键路径延迟,简称延迟:critical path delay (delay)
电路面积,简称面积:circuit area(area)
功率耗散,简称功耗:power dissipation(power)
功耗延迟积:power-delay product(PDP)
面积延迟积:area-delay product(ADP)
以上是衡量电路性能的指标,与电路最后的面积效率,能量效率有关。
Adder
1. 精确加法器
ripple-carry adder(RCA)行波进位加法器。
carry lookahead adder(CLA)超前进位加法器。
教科书级别的经典结构。可以当成baseline。
2. 近似加法器
2.1 Speculative Adders 推测加法器
almost correct adder(ACA)近乎正确加法器:
2.2 Segmented Adders 分段加法器
equal segmentation adder(ESA)相等分段加法器:
error-tolerant adder type II(ETAII)错误容忍加法器II型:
accuracy-configurable approximate adder(ACAA)精度可配置加法器。
2.3 Carry select Adders 进位选择加法器
speculative carry select adder(SCSA)推测进位选择加法器。
carry skip adder(CSA)进位跳过加法器。
carry speculative adder(CSPA)进位推断加法器。
carry approximate adder(CCA)进位近似加法器
generate signals–exploited carry speculation adder(GCSA)信号产生进位推断加法器。
2.4 Approximate Full Adders 近似全加器
lower-part-or adder(LOA)低位或加法器。
2.5 Truncated Adder 截断全加器
truncated adder(TruA)截断加法器。
2.6 对比结果
在这些近似加法器中,CSA是最准确的,而GCSA在MRED方面是第二准确的。LOA的结构与其他近似加法器不同。它更重要的部分是完全准确的,而近似部分则不那么重要。因此,LOA的MRED相当小,但其ER非常大。出于类似的原因,TruA的ER最高,MRED也非常大。在ESA和CSPA中,用于预测每个进位的信息相当有限,因此ESA和CSPA的ER和MRED比大多数其他近似设计大。与其他近似加法器相比,CCA、ETAII、SCSA和ACAA显示出适中的ER和MRED。在平均误差方面,LOA的值最低,因为它产生的正误差和负误差可以相互抵消,而对于其他近似加法器,由于只生成负误差,因此误差会累积。因此,LOA适合于累积操作。
不出所料,准确的CLAC在所有加法器中具有最长的延迟,但不是最高的功耗。与CLAC相比,CLAG的速度要快得多,消耗的功率和面积也更多。TruA 的速度不是很快,但它是最节能和最省面积的设计。与其他近似加法器相比,LOA的功率和面积效率也非常高。ESA是最慢的,但由于其简单的分割结构,它非常功率和面积效率。CCA速度非常快,但功率和面积最大。但 CSPA 速度更快,而 GCSA 使用的区域更小。CSA的速度和功耗都在中等范围内。就PDP和ADP而言(如表II所示),它们显示出非常相似的趋势。TruA、LOA 和 CSPA 的 PDP 和 ADP 值非常小,而 ACA 和 CCA 的这些值相对较大。
Multiplier
1. 精确乘法器
array multiplier(ArrayM)阵列乘法器。
wallence multiplier(WallanceM)华莱士乘法器。
教科书级经典乘法器结构。后面可以当作baseline。
2. 近似乘法器
2.1 Multipliers With Approximation in Genrating Partial Products 基于部分积产生近似的乘法器
underdesigned multiplier(UDM)欠设计乘法器。
2.2 Multipliers With Approximation in the Partial Product Tree 基于部分积树近似的乘法器
broken-array multiplier(BAM)破坏阵列乘法器。
error-tolerant multiplier(ETM)错误容忍乘法器。
static segment multiplier(SSM)静态分段乘法器。
approximate Wallence tree multiplier(AWTM)近似华莱士树乘法器。
2.3 Multipliers Using Approximate Counters or Compressors in the Partial Product Tree 基于部分积树内使用近似压缩器的乘法器
Approximate compressor-based multiplier(ACM)近似压缩器乘法器。
这里需要额外说明一下,基于这篇论文里给出的四种近似压缩器设计方案Design and Analysis of Approximate Compressors for Multiplication | IEEE Journals & Magazine | IEEE Xplore
一共分成了AM1,AM2,ACM-3,ACM-4。AM1和AM2是什么的缩写论文里没有说。
其中AM1和AM2的Truncated版本分别是TAM1和TAM2。
还有一个没有给出引用和全称的结构叫做ICM。我觉得可能是inaccurate compressor multiplier,不精确压缩器乘法器。
2.4 Approximate Booth Multipliers
probabilistic estimation booth multiplier(PEBM)概率估计布斯乘法器。
broken booth multiplier(BBM)破坏布斯乘法器。
approximate recoding multiplier(ABM)近似重编码乘法器。
此外还有几个结构是在布斯乘法后的部分积求和上做近似和截位,这些结构分别是BM04,BM07和BM11。
2.5 Truncated Multipliers
truncated multiplier(TruM)截断乘法器。
truncatedarray multiplier(TruMA)截断阵列乘法器。
truncated wallence multiplier(TruMW)华莱士树乘法器。
2.6 对比结果
总的来说,作为在生成部分积时近似的乘法器,UDM的NMED和MRED值非常大,而ER相对较小。在部分积树中近似的乘法器大多具有适中的NMED和非常大的MRED(除了截断位数少于或等于18位的BAM和AWTM-4)。使用近似计数器或压缩器近似的乘法器的NMED和MRED值都较小,而在输入操作数上截断的乘法器的这两个度量值都较大(当截断的LSB数量大于4时)。在考虑的近似Booth乘法器中,BBM在NMED和MRED方面显示出最低的准确性。BM11具有最小的平均误差。其他近似Booth乘法器显示出相似的NMED和各种MRED。
通常,功耗更高的乘法器具有更大的面积,因此PDP和ADP也更大。在功率和面积方面,TruMA、TruMW、ETM、TAM1/TAM2和BAM是最好的设计之一。这些设计的一个共同特点是它们都使用截断,这可以显著影响MRED,而NMED可能不会显著改变。如果大多数输入值较大,那么由截断引入的误差可以被容忍;因此,截断是一种节省面积和功率的有用方案。否则,基于截断的设计可能会产生无法接受的不准确结果。如果没有截断,一个在生成部分积时近似设计的乘法器(例如,UDM)往往具有大的延迟、功率和面积。在部分积加法中近似的乘法器(例如,AWTM)的这些度量是适中的,而使用近似计数器或压缩器(ICM、ACM、AM1、AM2)的乘法器需要更高的功率和面积。
在PDP和ADP方面,TruMA、TruMW、ETM、TAM1和TAM2的值非常小,而ICM、UDM和AM2则相反。AM1、ACM、BAM和AWTM的PDP和ADP值处于中等范围。对于近似Booth乘法器,PEBM是最快的,但由于使用了并行累加的进位保存加法器树,它非常耗电和面积。由于在基数-8算法中由耗时的重新编码加法器生成的部分积数量较少,ABM2是最慢但最节能和面积最小的设计。因此,它具有最小的PDP和适中的ADP值。没有误差补偿,BBM显示出小的延迟、低功耗和小的电路面积,因此与大多数其他设计(除ABM2和BM04外)相比,PDP和ADP较小。BM11和BM04在所有电路度量上具有相似的值。BM07具有相似的延迟,但功率和面积更高,因此PDP和ADP更大。
标签:multiplier,近似,笔记,加法器,adder,近似计算,MRED,Survey,乘法器 From: https://www.cnblogs.com/sasasatori/p/17989539