首页 > 其他分享 >intel培训-3 FPGA

intel培训-3 FPGA

时间:2023-02-21 19:08:50浏览次数:38  
标签:培训 intel FPGA 卷积 支持 可编程 单元 延迟

免费的数据集

NNIST

0-9 的手写体
28*28
测试功能

CIFAR-10

10个类别
50000张图片
32*32

imageNet

可以实用级别

1000个类别
224*224
120万张训练图像
50000张验证图片
100000张验证图片

网络

AlexNet

ImageNet分类比赛
图片识别率由之前的不过一半到接近80%
卷积神经网络开始得到重视
2017年 识别的错误率在2% 精度超过人类

Net

互连的拓扑结构
Rg:
AlexNet 
googleNet

框架

一个“操作系统” 
一个函数库 
子程序的集合

提供卷积运算

tf
Caffe

深度学习的基元库

特定于低级别的加速器的库
如 cIDNN MKL DLA cuDNN

FPGA

现场可编程门阵列

数电: 0 1 加减法 乘除法 

为了解决
设计电路过于复杂

最早的可编程器件(PRD):可以实现简单的可编程
一个窗口 一个编程器 用紫外线照射芯片 在紫外线的照射下可以擦除之前的痕迹

FPGA:
不需要取下芯片 现场可编程
逻辑单元 数百万的
存储器块
特殊功能的应用




FPAG基本单元查找表

基本单元
四输入查找表

四个信号
一个信号的输出 
一个逻辑单元可以实现

一个bit的(全加)加减
16个逻辑单元
实现简单的操作系统:
8086(最早的)
80286
80386

FPGA内存块

存储器块
大小不一
读写方式不同:可以两套读写方式

FPGA DSP模块

硬件的
乘累加的模块
节省逻辑单元
速度快

可以量化不同的精度的运算

FPGA 可配置路由

自定义数据路径
可以直接连接至定制或者标准IO接口

FPGA IO和接口

硬核内存控制器
支持连接片外内存(HBM,HMC,..)

英特尔的FPGA产品

MAX Cyclone Arria Stratix
从左至又速度变高 成本变高

采用FPGA定制的硬件所具备的优势

高效处理
精细化处理
低功效
灵活的芯片
支持重新配置
加快上市速度
多种可用I/O标准

FPGA和人工智能的关系

支持灵活控制数据路径

确定的低延时对推理至关重要:汽车自动驾驶
人的反应时间0.25秒

GPU:单指令多数据 装满显存一次执行
数据的延迟很高 吞吐率高 但是运行速度快

提供确定性系统延迟
I/O延迟 + 计算延迟

CPU:
延迟不确定
多任务,中断之类

支持灵活的任意架构:
努力提高网络开发效率 以消除GPU局限性
批处理
降低位宽
稀疏权重
稀疏激活

实现卷积CNN的要求

高吞吐率

多次浮点乘积累加运算 

高带宽本都存储,以存储过滤数据以及部分之和

支持不同的拓扑问题的灵活性

压缩算法

H.2265(HEVC) 
H.264(AVL)
MPEG-2

开源计算机视觉库(OpenCV)

2500 多个算法与函数
C++ python*  java* matlab*接口
使用经过优化的C/C++ 编写 支持OpenCL*

标签:培训,intel,FPGA,卷积,支持,可编程,单元,延迟
From: https://blog.51cto.com/liyunhao/6077007

相关文章

  • intel培训-1 数据预处理
    数据预处理:清理灰度处理: 零件缺陷检测,裂缝 减少数据量减少运算量只需要一个值正则化:normalization 分布不 加快收敛速度数据增强: 数据不均衡的时候为了增......
  • IC FPGA XC7A200T-1FFG1156I/XC7A200T-2FFG1156I参数 引脚图
    ICFPGAXC7A200T-1FFG1156I/XC7A200T-2FFG1156I引脚图型号:XC7A200T-1FFG1156I、XC7A200T-2FFG1156I类型:FPGA-现场可编程门阵列系列:XC7A200T逻辑元件数量:215360L......
  • Intel汇编语言程序设计笔记
    ⦁2^8=2562^10=10242^16=65536[二进制]1111=F[16进制]⦁ 有符号二进制整数的最高有效位[MSB]表示数的符号,0=正数1=负数⦁ 数据的意义,由其数据类型决定,单纯的数字没......
  • FPGA基于ACM2108的DDS设计
    这次设计一个DDS信号发生器。该设计的特点有:双通道的DA输出,可以调节频率、相位、和波形(正弦波、方波、三角波)。拥有相位重置的功能,能够同时重置两个输出波形的相位。本......
  • Wintel联盟:Windows+Intel  PC时代的“双霸主神话”
     正所谓,时势造英雄。 1981年8月12日,IBM公司正式推出全球第一台个人电脑IBM5150。当时,IBM为了加速研发进度一改公司传统,IBM5150采用通用标准部件,开放除BIOS以外的......
  • Intel CPU发展简史
    1971年:40041971年11月15日,Intel公司的工程师霍夫发明了世界上第一个商用微处理器—4004,从此这一天被当作具有全球IT界里程碑意义的日子而被永远的载入了史册。这款4位微......
  • 部分信创CPU算力与IntelCPU的简单比较
    部分信创CPU算力与IntelCPU的简单比较摘要最近一直想查看一下国产和非国产的CPU的性能比较从最开始学习研究sysbench到周五晚上开始学习stress-ng今天查看github上......
  • FPGA优质开源项目
    1、riscduino仓库地址:https://github.com/dineshannayya/riscduinoRiscduinoisaSingle32bitRISCVbasedSOCdesignpincompatibletoarduinoplatformandthi......
  • IC FPGA 484FBGA 10M50DCF484I6G、10M50DCF484I7G详细参数
    ICFPGA360I/O484FBGA10M50DCF484I6G、10M50DCF484I7G详细参数1、10M50DCF484I6G产品种类: FPGA-现场可编程门阵列 系列: MAX1010M50 逻辑元件数量: 50000LE......
  • 汽车和消费应用10M50DAF484I6G FPGA现场可编程门阵列 参数
    MAX10器件是单芯片、非易失性低成本可编程逻辑器件(pld),用于集成最优的系统组件集。10M50DAF484I6G产品种类: FPGA-现场可编程门阵列 系列:MAX1010M50引脚数:484明佳......