学fpga（从verilog到hls）

时间：2022-11-23 23:02:42浏览次数：80

hls，全称为high level synthesis。也就是说从更高一级的语言来完成电路的综合。从前，编写fpga只有一个方法，都是编写verilog类似的硬件语言。但是如何用c、c++编写可综合的逻辑，这就变得很重要了，毕竟c、c++工程师比fpga的工程师要多得多。

1、hls的重要性

从某种意义上，hls会极大拓展目前fpga的应用领域。相比较mcu、arm soc来说，fpga目前还是集中于信号采样、数字信号处理、模数转换这些场景。但是在目前比较兴起的人工智能领域，fpga着墨不多，一个相反的例子就是gpu。从前gpu只是一个图形加速器，后来连续在游戏和人工领域不断发力，使得gpu的应用领域越来越多，关联公司的规模也越来越大。

2、c语言和并发的悖论

c语言本身是一个串行代码，它和并发并不完全一致，从这方面来说，可以看成一个周期为1的特殊fpga代码。所以，在设计的过程中，难点不在于语言本身，而是在于并行的思维。c语言本身不直接变成网表，也是先变成verilog语言，再转成网表的。要实现这一步，就要在c语言上做一些修改和限制，这就是hls的初衷。

3、verilog和waveform不能丢

此外，hls改造后，如何判断hls是不是想要的效果，除了看综合效果后，也需要看对应的waveform，这点无可取代。不要指望代码编写好，就有一个立马的性能改善效果。

4、先编写c代码，再优化hls

对于软件工程师来说，先保证c逻辑没问题，再一步一步优化。优化的方法基本就是添加各种directive，也就是pragma标志。基本方法是三种，1、边收集数据边处理；2、并发；3、流水线。本质上都是各种串行限制，减少算法的latency。

5、hls仍然需要时序图、波形图设计

hls一般都是默认做串行处理，比如下面一段代码，

for(int i = 0; i < 10; i++)
{
    b[i] = a[i] + c + d;
}

如果没有任何的说明，那基本上就是loop body里面的运算代码顺序执行10次。如果需要进行显式的加速，可以把循环打开、用pipeline，这样基本就可以加速处理。加速不是没有代价的，基本的方法都是空间换时间，这中间有一个权衡，算法可能快了，但是资源也可能不够了。一个巧妙的办法，就是先设计图形，等testbench的时候，把测试的图形和设计的图形进行对比，这样就可以达到事半功倍的效果，不过度优化也是很重要的。

6、注意接口、内存、hls提供的函数

hls怎么和bus接口沟通，函数里面的内存怎么映射，这里面hls都提供了很好的方法。此外，对于一般的函数功能，hls也提供了对应的优化，尤其是opencv提供的一些函数，hls都有对应的版本。

7、学习hls的另一个思路

如果需要把fpga应用到更多的场合，那么hls至少从目前来说还是必由之路。

8、hls视频教程

https://www.bilibili.com/video/BV1J5411t7uE

ps：

很多人可能很难理解，既然fpga做算法这么烦，为什么还要用。我想主要还是因为低频的fpga算法性能可以和数倍于自己的soc一样好，电路相对还简单一点，成本、供应链也没那么紧张。尤其是对于非标产品来说，特别合适。

标签：语言,fpga,代码,hls,verilog,编写
From： https://blog.51cto.com/feixiaoxing/5881888

学fpga（在线verilog编程）
很多编程不方便的同学，可以利用在线工具进行编程。比如现在，https://hdlbits.01xz.net/wiki/Main_Page这个网站就非常不错，适合暂时还没有安装quartus、vivado的同......
Going Deeper with Embedded FPGA Platform for Convolutional Neural Network
题目：GoingDeeperwithEmbeddedFPGAPlatformforConvolutionalNeuralNetwork日期&会议：Proceedingsofthe2016ACM/SIGDAInternationalSymposiumonField-Prog......
FPGA HC-SR04
moduledistance(clock,clr_n,trig,echo,out_dis);inputclock,clr_n;//时钟信号复位信号inputecho;//测距模块outputregtrig;//测距模块outputregout_dis;//......
DSP+FPGA评估板 TI TMS320C6657 1.25GHz-DSP原理图
TI公司的TMS320C6655/57是不定点/浮点数字信号处理器（DSP），基于KeyStone多核架构，内核速度高达1.25GHz，集成了各种包括C66x内核，存储器子系统，外设和加速器在内的各......
Verilog语法入门
VerilogHDL是一种硬件描述语言（HDL:HardwareDescriptionLanguage），以文本形式来描述数字系统硬件的结构和行为的语言，用它可以表示逻辑电路图、逻辑表达式，还可以表示数字逻辑......
FPGA ——防止信号被优化（转载）
转载：https://blog.csdn.net/weixin_46062412/article/details/125299437Quartus对这种情况的处理是增加约束，共有2种情况：a，需要保留的信号类型是wire在定......
【幅频均衡带通滤波器】基于FPGA的幅频均衡带通滤波器的
1.软件版本matlab2013b,quartusii121.2.本算法理论知识带通滤波器在数字幅频均衡功率放大器中一个重要的组成部分，在介绍带通滤波器之前，我们首先来详细介绍一下数字幅频......
XC5VLX30T-2FF323I(XC5VLX30T-1FF323C) FPGA Virtex-5 LXT可编程器件
概述Virtex-5FPGA有-3，-2，-1速度等级，其中-3具有最高的性能。Virtex-5FPGA直流和交流特性指定为商业和工业级别。除工作温度范围外，除非另有说明，所有直流和交流电气参数对于......
基于VScode搭建Verilog自动格式化
基于VScode搭建Verilog自动格式化插件Verilog-HDL/SystemVerilog/BluespecSystemVerilogSystemVerilogandVerilogFormatter工具https://github.com/googl......
【读书笔记】《Verilog HDL数字设计与综合（第二版本科教学版）》第一章：Verilog HDL数字
一、数字电路CAD技术的发展历史真空管晶体管，集成电路（IntegratedCircuit,IC）小规模集成电路（SmallScaleIntegrated,SSI）：逻辑门数量很少中规模集成电路（MediumScaleI......

学fpga（从verilog到hls）

相关文章

赞助商

阅读排行