首页 > 其他分享 >XILINX FPGA 1/4/8通道PCIe DMA控制器IP,高性能版本IP介绍应用

XILINX FPGA 1/4/8通道PCIe DMA控制器IP,高性能版本IP介绍应用

时间:2024-03-10 23:22:05浏览次数:30  
标签:Subsystem DMA FPGA IP 接口 PCIe H2C 通道

Multi-Channel PCIe QDMA&RDMA IP

1    介绍

基于PCI Express Integrated Block,Multi-Channel PCIe QDMA Subsystem实现了使用DMA地址队列的独立多通道、高性能Continous或Scather Gather DMA,提供FIFO/AXI4-Stream用户接口。

基于PCI Express Integrated Block,Multi-Channel PCIe RDMA Subsystem实现了使用DMA Ring缓冲的独立多通道、高性能/超低延时/超低抖动Continous Ring DMA,提供FIFO/AXI4-Stream用户接口。

1.1      特性

  • 支持Ultrascale+,Ultrascale,7 Series的PCI Express Integrated Block
  • 支持64,128,256,512-bit数据路径
  • 64-bit源地址,目的地址,和描述符地址
  • 多达8个独立的host-to-card(H2C/Read)数据通道或H2C DMA
  • 多达8个独立的card-to-host(C2H/Write)数据通道或C2H DMA
  • AXI4-Stream/FIFO用户接口(每个通道都有自己的AXI4-Stream/FIFO接口)
  • 每个DMA引擎支持DMA地址队列,队列深度可达32
  • 每个DMA引擎支持DMA Ring缓冲,Ring缓冲深度和个数可配置
  • RDMA的超低延时和超低抖动性
  • H2C DMA支持视频显示定时时序输入控制
  • AXI4-Lite Master接口允许PCIe通信绕过DMA引擎
  • Scather Gather描述符列表支持无限列表大小
  • 每个描述符的最大传输长度为4GB
  • MSI中断
  • 连续描述符的块获取
  • 中断或查询模式

1.2      应用

本内核体系结构支持广泛的计算和通信目标程序应用,强调性能、成本、可扩展性、功能可扩展性和关键任务可靠性。典型应用包括:

● 数据通信网络

● 电信网络

● 宽带有线和无线应用

● 网络接口卡

● 用于各种应用程序的服务器add-in card

典型应用如下图所示:

 

 

图 1 Multi-Channel PCIe QDMA&RDMA Subsystem典型应用:8通道视频采集和视频显示

2    概述

Multi-Channel PCIe QDMA&RDMA Subsystem作为一个高性能DMA数据搬移器,内核通过AXI4-Stream/FIFO接口直接连接RTL逻辑。使用提供的字符驱动程序,AXI4-Stream/FIFO接口可用于PCIe地址空间和AXI地址空间之间的高性能数据搬移。除了基本的DMA功能,DMA支持多达8个独立的upstream和downstream通道,每个通道支持深度为32的DMA地址队列,以及深度和个数可配置的DMA Ring缓冲,另外还允许PCIe通信绕过DMA引擎。

 

 

图 2 Multi-Channel PCIe QDMA&RDMA Subsystem概述

2.1      特性概要

基于描述符提供的信息:源地址,目的地址和传输数据长度,Multi-Channel PCIe QDMA&RDMA Subsystem实现Host存储器和PCIe DMA子系统之间的数据搬移。这些DMA可以同时是Host to Card(H2C)和Card to Host(C2H)传输。每个DMA通道对应各自的AX4-Stream/FIFO接口,DMA从Host存储器获取并解析描述符链表,基于描述符链表信息完成自己通道的数据传输,然后使用MSI中断发出描述符完成或错误的信令。内核也提供多达16个输出到Host的用户中断信号。

主机可以通过以下2个接口访问用户逻辑:

  • AXI4-Lite Master配置接口:这个接口是一个固定的32-bit端口,用于对性能要求不高的用户配置和状态寄存器的访问
  • User Register:这个接口是多个32-bit向量信号和1-bit信号,这些信号来自对应DMA通道数据搬移过程中产生的控制或状态信号

3    产品规格

结合Integrated Block for PCI Express IP,Multi-Channel PCIe QDMA&RDMA Subsystem为PCIe提供了一个高性能的DMA解决方案。

3.1            性能

Endpoint配置参数:

  1. Max Payload Size=256-byte
  2. Max Read Request Size=512-byte
  3. DMA Transfer Length = 4MB

C2H & H2C DMA性能:

  1. PCIe 3.0 x16,C2H DMA和H2C DMA速度大于13.5GB/s
  2. PCIe 3.0 x8,C2H DMA和H2C DMA速度大于7GB/s
  3. PCIe 2.0 x8,C2H DMA和H2C DMA速度大于3.6GB/s
  4. PCIe 2.0 x4,C2H DMA和H2C DMA速度大于1.7GB/s

3.2            资源

表1 PCIe 3.0 x16 DMA Subsystem资源(8通道)

 

LUTs

FFs

BRAMs

PCIe

资源

44272

99014

165.5

1

表2 PCIe 3.0 x8 DMA Subsystem资源(8通道)

 

LUTs

FFs

BRAMs

PCIe

资源

26356

51523

93

1

表3 PCIe 2.0 x8 DMA Subsystem资源(8通道)

 

LUTs

FFs

BRAMs

PCIe

资源

26614

33766

70

1

表4 PCIe 2.0 x4 DMA Subsystem资源(8通道)

 

LUTs

FFs

BRAMs

PCIe

资源

20466

29623

106

1

表5 PCIe 3.0 x16 DMA Subsystem资源(1通道)

 

LUTs

FFs

BRAMs

PCIe

资源

22353

55492

37

1

表6 PCIe 3.0 x8 DMA Subsystem资源(1通道)

 

LUTs

FFs

BRAMs

PCIe

资源

8113

21656

17

1

表7 PCIe 2.0 x8 DMA Subsystem资源(1通道)

 

LUTs

FFs

BRAMs

PCIe

资源

11074

16221

10

1

表8 PCIe 2.0 x4 DMA Subsystem资源(1通道)

 

LUTs

FFs

BRAMs

PCIe

资源

6270

8588

29

1

3.3            驱动程序

(1) Windows WDF (Queue or Non-Queue,Ring)

(2) Linux (Queue or Non-Queue,Ring)

(3) V4L2

4    交付清单

可交付资料:

1. 详细的用户手册

2. 设计文件:源代码或网表

3. 时序约束

4. 测试或Demo工程

5. 技术支持:邮件,电话,现场,培训服务

6. Email:[email protected]

 

标签:Subsystem,DMA,FPGA,IP,接口,PCIe,H2C,通道
From: https://www.cnblogs.com/zhang-fpgachipip/p/18065088

相关文章

  • Typescript学习笔记(一)
    学习日期:03-09-2024关键字:Typescript;安装;原始数据类型;Any类型;数组;元组;Typescript是Javascript的超集,显著区别是加了静态类型风格的类型系统、es6-es10-esnext的语法支持安装npminstall-gtypescript原始数据类型Boolean、Null、Undefined、Number、BigInt、String、Sy......
  • FPGA的DAC转换部分遇到的问题
    利用线性序列机根据时序图和手册中的输出值的对应关系。DAC这边的知识基本相同。在验证的时候发现了问题,反推仿真的时候发现了,子啊lsm_cnt线性序列机计数的33到了之后还有一位,发现是set_en的问题,因为set_en使能才能计数。这边是正确的波形图和代码对应always@(posedgeclko......
  • RIPEMD算法:多功能哈希算法的瑰宝
    一、RIPEMD算法的起源与历程RIPEMD(RACEIntegrityPrimitivesEvaluationMessageDigest)算法是由欧洲研究项目RACE发起,由HansDobbertin、AntoonBosselaers和VincentRijmen共同设计的一种哈希算法。RIPEMD算法最早发布于1996年,旨在提供一种安全、高效的数据完整性验证工具。......
  • 要确保请求在一次会话中被转发到相同的后端服务器上,可以使用 Nginx 的 ip_hash 或 sti
    要确保请求在一次会话中被转发到相同的后端服务器上,可以使用Nginx的ip_hash或sticky模块来实现。ip_hash模块:ip_hash 模块使用客户端IP地址作为哈希键,将同一IP地址的请求始终转发到相同的后端服务器。要启用 ip_hash 模块,只需在Nginx配置文件的 http 块或......
  • 2.1 Linux 网络相关概念和修改IP地址的方法
    2.1Linux网络相关概念和修改IP地址的方法2.1.1网卡的命名规则Centos6的网卡命名方式:它会根据情况有所改变而非唯一且固定,在Centos6之前,网络接口使用连续号码命名:如eth0、eth1等,当增加或删除网卡时,名称可能会发生改变Centos7采用dmidec......
  • 基于肤色模型和中值滤波的手部检测算法FPGA实现,包括tb测试文件和MATLAB辅助验证
    1.算法运行效果图预览RTL图:   仿真图:   导入到matlab显示效果如下:   2.算法运行软件版本matlab2022a vivado2019.2 3.算法理论概述      在计算机视觉领域,基于肤色模型和中值滤波的手部检测方法是一种常见的初步定位策略。该方法主要分为......
  • [JavaScript] JavaScript的时间与时区
    0序言第1章节,原创,主要关注:JS的时间、时区国际化问题第2章节,主要来自于第1篇参考文献(系对第1章节的基础知识的夯实)1JavaScript时间、时区的国际化(案例)本案例等同于问题:JavaScript从浏览器根据不同时区获取时间的问题假定现在有两台Windows笔记本电脑。Step1设置......
  • noip游记(寄
    好好好,2023.11.19,登录hoj,每日一言:“时光一逝永不回,往事只能回味。”(那时候还有每日一言,现在变成倒计时了……)(连oj都知道,真的……我哭死……T_T)虽然说这名之为noip游记,但是其实是自九月份以来的first.备战csp波波选了初三全体和初二部分停了一周课,全天竞赛上到10点。个人比......
  • [NOIP2017 提高组] 小凯的疑惑 / [蓝桥杯 2013 省] 买不到的数目
    这肯定是学证明了,看这篇文章补充一下细节首先,\(m\)的范围应该是\([0,b-1]\)然后,当\(m\)取不同值的时候,\(ma\)%\(b\)一定为不同值(这个性质确实有点奇特,可以记下来)反证,如果\(m_1a\equivm_2a\:(mod\:b)\)且\(0≤m_1<m_2≤b-1\),那么就有\(b|(m_2-m_1)a\),题目给出了\(a,b\)互质,......
  • 【软件安装】pytorch安装(windows10,pip版)
    前提必须先安装cuda与cudnn,教程:cuda与cudnn部署安装同时确认你的CUDA版本,nvidia-smi:确认版本是12.4,继续往下走安装pytorch前往官网,并且往下滑动,直到你看见INSTALLPYTORCH:PyTorch看左下角的PreviousversionsofPyTorch,点进去:这里显示最新的是v2.2.0版本,咱就下这个,按设......