首页 > 其他分享 >近似计算Survey阅读笔记

近似计算Survey阅读笔记

时间:2024-01-26 15:47:01浏览次数:32  
标签:multiplier 近似 笔记 加法器 adder 近似计算 MRED Survey 乘法器

近似计算Survey阅读笔记

论文:A Review, Classification, and Comparative Evaluation of Approximate Arithmetic Circuits | ACM Journal on Emerging Technologies in Computing Systems

指标

错误率:error rate(ER)

错误距离:error distance(ED)

归一化平均错误举例:normalized mean error distance(NMED)

平均相对错误距离:mean relative error distance(MRED)

平均错误:average error

以上是衡量近似计算结构的错误特性的指标,与最后计算结果的accuracy有关。

关键路径延迟,简称延迟:critical path delay (delay)

电路面积,简称面积:circuit area(area)

功率耗散,简称功耗:power dissipation(power)

功耗延迟积:power-delay product(PDP)

面积延迟积:area-delay product(ADP)

以上是衡量电路性能的指标,与电路最后的面积效率,能量效率有关。

Adder

1. 精确加法器

ripple-carry adder(RCA)行波进位加法器。

carry lookahead adder(CLA)超前进位加法器。

教科书级别的经典结构。可以当成baseline。

image

2. 近似加法器

2.1 Speculative Adders 推测加法器

almost correct adder(ACA)近乎正确加法器:

image

2.2 Segmented Adders 分段加法器

equal segmentation adder(ESA)相等分段加法器:

image

error-tolerant adder type II(ETAII)错误容忍加法器II型:

image

accuracy-configurable approximate adder(ACAA)精度可配置加法器。

2.3 Carry select Adders 进位选择加法器

speculative carry select adder(SCSA)推测进位选择加法器。

image

carry skip adder(CSA)进位跳过加法器。

carry speculative adder(CSPA)进位推断加法器。

carry approximate adder(CCA)进位近似加法器

generate signals–exploited carry speculation adder(GCSA)信号产生进位推断加法器。

2.4 Approximate Full Adders 近似全加器

lower-part-or adder(LOA)低位或加法器。

image

2.5 Truncated Adder 截断全加器

truncated adder(TruA)截断加法器。

2.6 对比结果

image

image

在这些近似加法器中,CSA是最准确的,而GCSA在MRED方面是第二准确的。LOA的结构与其他近似加法器不同。它更重要的部分是完全准确的,而近似部分则不那么重要。因此,LOA的MRED相当小,但其ER非常大。出于类似的原因,TruA的ER最高,MRED也非常大。在ESA和CSPA中,用于预测每个进位的信息相当有限,因此ESA和CSPA的ER和MRED比大多数其他近似设计大。与其他近似加法器相比,CCA、ETAII、SCSA和ACAA显示出适中的ER和MRED。在平均误差方面,LOA的值最低,因为它产生的正误差和负误差可以相互抵消,而对于其他近似加法器,由于只生成负误差,因此误差会累积。因此,LOA适合于累积操作。

image

image

image

不出所料,准确的CLAC在所有加法器中具有最长的延迟,但不是最高的功耗。与CLAC相比,CLAG的速度要快得多,消耗的功率和面积也更多。TruA 的速度不是很快,但它是最节能和最省面积的设计。与其他近似加法器相比,LOA的功率和面积效率也非常高。ESA是最慢的,但由于其简单的分割结构,它非常功率和面积效率。CCA速度非常快,但功率和面积最大。但 CSPA 速度更快,而 GCSA 使用的区域更小。CSA的速度和功耗都在中等范围内。就PDP和ADP而言(如表II所示),它们显示出非常相似的趋势。TruA、LOA 和 CSPA 的 PDP 和 ADP 值非常小,而 ACA 和 CCA 的这些值相对较大。

Multiplier

1. 精确乘法器

image

array multiplier(ArrayM)阵列乘法器。

wallence multiplier(WallanceM)华莱士乘法器。

教科书级经典乘法器结构。后面可以当作baseline。

2. 近似乘法器

2.1 Multipliers With Approximation in Genrating Partial Products 基于部分积产生近似的乘法器

underdesigned multiplier(UDM)欠设计乘法器。

image

2.2 Multipliers With Approximation in the Partial Product Tree 基于部分积树近似的乘法器

broken-array multiplier(BAM)破坏阵列乘法器。

image

error-tolerant multiplier(ETM)错误容忍乘法器。

image

static segment multiplier(SSM)静态分段乘法器。

approximate Wallence tree multiplier(AWTM)近似华莱士树乘法器。

image

2.3 Multipliers Using Approximate Counters or Compressors in the Partial Product Tree 基于部分积树内使用近似压缩器的乘法器

Approximate compressor-based multiplier(ACM)近似压缩器乘法器。

这里需要额外说明一下,基于这篇论文里给出的四种近似压缩器设计方案Design and Analysis of Approximate Compressors for Multiplication | IEEE Journals & Magazine | IEEE Xplore

一共分成了AM1,AM2,ACM-3,ACM-4。AM1和AM2是什么的缩写论文里没有说。

其中AM1和AM2的Truncated版本分别是TAM1和TAM2。

image

还有一个没有给出引用和全称的结构叫做ICM。我觉得可能是inaccurate compressor multiplier,不精确压缩器乘法器。

2.4 Approximate Booth Multipliers

probabilistic estimation booth multiplier(PEBM)概率估计布斯乘法器。

broken booth multiplier(BBM)破坏布斯乘法器。

approximate recoding multiplier(ABM)近似重编码乘法器。

此外还有几个结构是在布斯乘法后的部分积求和上做近似和截位,这些结构分别是BM04,BM07和BM11。

image

2.5 Truncated Multipliers

truncated multiplier(TruM)截断乘法器。

truncatedarray multiplier(TruMA)截断阵列乘法器。

truncated wallence multiplier(TruMW)华莱士树乘法器。

image

2.6 对比结果

image
image

总的来说,作为在生成部分积时近似的乘法器,UDM的NMED和MRED值非常大,而ER相对较小。在部分积树中近似的乘法器大多具有适中的NMED和非常大的MRED(除了截断位数少于或等于18位的BAM和AWTM-4)。使用近似计数器或压缩器近似的乘法器的NMED和MRED值都较小,而在输入操作数上截断的乘法器的这两个度量值都较大(当截断的LSB数量大于4时)。在考虑的近似Booth乘法器中,BBM在NMED和MRED方面显示出最低的准确性。BM11具有最小的平均误差。其他近似Booth乘法器显示出相似的NMED和各种MRED。

image

image

image

通常,功耗更高的乘法器具有更大的面积,因此PDP和ADP也更大。在功率和面积方面,TruMA、TruMW、ETM、TAM1/TAM2和BAM是最好的设计之一。这些设计的一个共同特点是它们都使用截断,这可以显著影响MRED,而NMED可能不会显著改变。如果大多数输入值较大,那么由截断引入的误差可以被容忍;因此,截断是一种节省面积和功率的有用方案。否则,基于截断的设计可能会产生无法接受的不准确结果。如果没有截断,一个在生成部分积时近似设计的乘法器(例如,UDM)往往具有大的延迟、功率和面积。在部分积加法中近似的乘法器(例如,AWTM)的这些度量是适中的,而使用近似计数器或压缩器(ICM、ACM、AM1、AM2)的乘法器需要更高的功率和面积。

在PDP和ADP方面,TruMA、TruMW、ETM、TAM1和TAM2的值非常小,而ICM、UDM和AM2则相反。AM1、ACM、BAM和AWTM的PDP和ADP值处于中等范围。对于近似Booth乘法器,PEBM是最快的,但由于使用了并行累加的进位保存加法器树,它非常耗电和面积。由于在基数-8算法中由耗时的重新编码加法器生成的部分积数量较少,ABM2是最慢但最节能和面积最小的设计。因此,它具有最小的PDP和适中的ADP值。没有误差补偿,BBM显示出小的延迟、低功耗和小的电路面积,因此与大多数其他设计(除ABM2和BM04外)相比,PDP和ADP较小。BM11和BM04在所有电路度量上具有相似的值。BM07具有相似的延迟,但功率和面积更高,因此PDP和ADP更大。

标签:multiplier,近似,笔记,加法器,adder,近似计算,MRED,Survey,乘法器
From: https://www.cnblogs.com/sasasatori/p/17989539

相关文章

  • Excel表格转GDScript插件的使用 学习笔记
    【【蘩】[Godot教程]Excel表格转GDScript插件的使用】ConfigHelper导出生成在excels文件夹下。添加新的字符串。导出表格,会被忽略掉的(如注释内容)"ignore":true......
  • Springcloud学习笔记61---Spring MVC的拦截器HandlerInterceptor
    1. HandlerMethod介绍HandlerMethod它作为SpringMVC的非公开API,可能绝大多数小伙伴都对它比较陌生,但我相信你对它又不是那么的生疏,因为你可能没用过但肯定见过。比如SpringMVC的拦截器HandlerInterceptor的拦截方法的第三个入参Objecthandler,虽然它是Object类型,但其实绝大部......
  • 【学习笔记】链式前向星
    链式前向星,是一种邻接表存图的方式。本质上是用数组模拟一个链表。适合存各种类型的图,但是查询两节点间的边是否存在很不方便,对出边进行排序也很麻烦。#include<iostream>#include<algorithm>#include<cstring>#include<queue>usingnamespacestd;constintN=1e5+5;type......
  • 数学建模入门笔记(2) 聚类分析
    聚类分析​ 聚类分析(ClusterAnalysis):又称群分析,对多个样本/指标定量分类的多元分析方法,是无监督学习1聚类分析的分类​Q型聚类(QualitativeClustering):也称硬聚类,一般用于将样本聚类,每一簇之间无交集,用距离作为相似性度量,包括K-Means聚类、层次聚类、DBSCAN聚类等​ R......
  • exgcd+乘法逆元相关笔记
    #include<iostream>#include<cstdio>usingnamespacestd;constintpass=0;//exgcd://求解二元一次不定方程//ax+by=(a,b)=(b,a%b)=bx'+(a%b)*y'=bx'+(a-b*(a/b))*y'=b*(x'-(a/b)*y')+ay'//则有y=(x'-(a/b)*y'),x=y'......
  • 『学习笔记』重谈圆锥曲线
    定义第一定义:圆锥曲线,又称二次曲线,是由一平面截二次锥面得到的曲线。包括椭圆、抛物线和双曲线。二次曲线标准解析式为\(ax^2+bxy+cy^2+dx+ey+f=0\),在不同情况下会退化。第二定义:到定点(焦点)与到定直线(准线)的距离之比为常数\(e\)的点的轨迹。分类几何分类当平面与二次锥......
  • [SQLAlchemy] sqlAlchemy学习笔记(3): 在orm中使用join
    JOIN连接表➡️官方文档⬅️在sqlalchemy中实现JOIN/ON语句,需要用到Select.join()或者Select.join_from()假设我们有两张表(在python中就变成了两个类)User和Address,User表中有一列addresses,表示该用户使用的所有地址的集合(反映到代码中,就是Address对象的集合);同时Ad......
  • 圆方树学习笔记
    圆方树学习笔记圆方树是优秀的图论算法,从仙人掌图向无向图扩展,利用割点和点双联通分量的性质,实现了图向树的转换。对仙人掌的处理:圆方树——处理仙人掌的利器而且实现十分简单算法思路前置知识割点和桥,点双联通分量。思路对于一个无向图,圆方树理解可以如下:原图中点是圆......
  • 人工智能(第3版) 第二章—学习笔记
    人工智能(第3版)第二章—学习笔记2.0简介:智能系统中的搜索这一部分内容简单的列举了我们生活中出现的一些常见的搜索问题,并简单介绍了本章之后需要学习的状态分析图,生成——测试搜索范式,盲目搜索算法,贪心算法和回溯法等内容。2.1状态空间图状态空间图(state-spacegraph)是对......
  • WebAssembly入门笔记[2]:利用Memory传递数据
    利用灵活的“导入”和“导出”机制,WebAssembly与承载的JavaScript应用之间可以很便利地“互通有无”。《与JavaScript的交互》着重演示了如何利用函数的导入和导出实现功能的共享,接下来我们主要关注数据的传递或者共享。宗地来说,WebAssembly与宿主程序之间的数据传递主要有如下三......