首页 > 其他分享 >DSA

DSA

时间:2023-05-08 10:26:04浏览次数:25  
标签:运算 编程语言 存储器 TPU 缓冲区 DSA

GPU

Warp:所有能够向量化执行的线程。

 

GPU ISA

GPU微结构和指令集经常变动。

 

保证适用性

编译为伪汇编程序,作为中间语言。

 

系统级别指令

指令语义

调度:核不是抢占式的,但是可以被外部中断。

内存管理:不倾向于用虚存,只通过简单映射拿到存储地址。

 

 

 

领域专用架构(DSA,Domain-Specific Architectures)

DSA设计原理

使用专门的存储器来最小化数据移动。(专门存储器,减少数据移动)

投入更多的运算单元和更多的存储器资源。(更多运算单元,更多存储器)

使用与应用领域匹配的最简单的并行结构。(简单并行架构)

将数据大小和类型减少到符合领域最简单的需求。(最简单的数据类型)

使用面向特定应用领域的特定编程语言。(面向编程语言)

 

TPU

TPU处理单元

简化控制,控制逻辑相对较少。

TPU ISA定义(五类指令)

Read_Host_Memory:读内存,从CPU内存读入统一的缓冲区(从CPU读数据

Read_Weights:将权重存储器中的权重数据读入权重FIFO。(从权重存储器读取权重

MatrixMatrixMultiply/卷积:矩阵乘法。(卷积

 计算激活函数 (激活

Write_Host_Memory:-将加速器自有的统一缓冲区中的数据写入主机内存。(写数据到主机)

 

TPU构造

控制单元只占了2%。最大的两个分别是:本地统一缓冲区(29%),和矩阵乘法单元(24%)。

 

TPU设计原理(基本符合DSA设计原理)

专用存储器:24个MiB专用缓冲区,4个MiB累加器缓冲区

大量运算和存储资源:60%的存储器,250倍算术运算单元

最简单的并行形式:2维SIMD并行性

数据大小和类型:8位整数

编程语言:tensorflow。

 

Catapult设计原理

专用存储器:5个MiB专用存储器。

大量运算和存储资源:3926个算术运算单元

最简单的并行形式:CNN的2维SIMD并行性,搜索评分的MISD(多指令多数据)并行性。

数据大小和类型:8位整数64位浮点数混合

编程语言:Verilog RTL。

 

Visual Core设计原理

专用存储器:每个核128+64MiB专用存储器。

大量运算和存储资源:每个核包含16x162D处理单元阵列2D移动网络

最简单的并行形式:2D SIMD(单指令多数据)VLIM(超长指令集)

数据大小和类型:8位整数和16位整数混合。

编程语言:图像处理的Halide和CNN的Tensorflow。

生态分析

站在芯片厂家的视角:希望把用户捆绑到自己私有的架构平台上,让用户形成依赖。

站在用户的视角:不愿意形成对特定厂家依赖,需要具备一定的通用性,方便应用跨硬件平台迁移

厂商博弈的最终结果:形成一个开源开放的行业生态(长远趋势)。

 

标签:运算,编程语言,存储器,TPU,缓冲区,DSA
From: https://www.cnblogs.com/RedNoseBo/p/17354640.html

相关文章

  • 浅谈医用IT隔离电源在DSA手术室配电中的应用
    罗轩志安科瑞电气股份有限公司上海嘉定201801 摘要:随着科技的不断进步,医院的电气设备在不断更新、增多,于是对配电要求越来越高。在确保电气装置的安全和所连接的医用电气......
  • 【译】clang ThreadSafetyAnalysis 线程安全分析
    每天晚上临睡前一到两小时,前后花了一两周来试着翻译。过程是痛苦的,却是一个检视自己的好办法。放在git上,正在考虑以后把随笔迁到gitio上。目录clang3.5线程安全分析名词......
  • Landsat数据在USGS中无法下载Surface Reflectance产品的解决方法
      本文介绍在USGS官网下载Landsat遥感影像数据时,出现报错信息,无法下载地表反射率产品(SurfaceReflectance)的解决办法。  最近,利用这篇文章批量下载Landsat遥感影像的......
  • 遇到:ECDSA host key ... for has changed and you have requested strict checking
    问题:远程ssh连接机器遇到如下报错。ECDSAhostkey“ip地址”forhaschangedandyouhaverequestedstrictchecking我图没了,借一下别人报错图。  解决:......
  • 批量下载Landsat遥感影像的方法
      本文介绍在USGS网站批量下载Landsat系列遥感影像的方法。  首先,打开EarthExplorer的官网,首先完成注册与登录。  接下来,点击左侧“SearchCriteria”,首先选择研究......
  • Breaking ECDSA from nonce bits
    如果对HNP不太了解,可以先看一下我的另一篇文章HNPPreview先简单回顾一下HNP和ECDSA。HiddenNumberproblem(HNP):有一个对外保密的数\(\alpha\)和对外公开的模数\(n\)......
  • DSA-Python
    19.55AlgorithmsandDataStructuresTutorial-FullCourseforBeginnershttps://www.ytb*.com/watch?v=8hly31xKli0&t=334s1.Algorithm1.1IntroductionAlgorit......
  • fasfdasfdsa
    如果希望自己每次都可以顺利地解决无线不能上网的问题,需要具备哪些技能才可以做到呢?1、要分清我们常用的操作系统都有哪些?电脑硬件、键盘上的键都叫什么名称、如何区分、......
  • ASEMI代理艾赛斯二极管DSA300I100NA,肖特基DSA300I100NA
    编辑-Z艾赛斯硅肖特基二极管DSA300I100NA参数:型号:DSA300I100NA最大重复反向阻断电压(VRRM):100V反向电流、漏极电流(IR):3mA正向电压降(VF):0.99V平均正向电流(IF):300A总功耗(Ptot):830W最......
  • ASEMI代理艾赛斯二极管DSA300I100NA,肖特基DSA300I100NA
    编辑-Z艾赛斯硅肖特基二极管DSA300I100NA参数:型号:DSA300I100NA最大重复反向阻断电压(VRRM):100V反向电流、漏极电流(IR):3mA正向电压降(VF):0.99V平均正向电流(IF):300A总功耗(Pt......