首页 > 编程语言 >《CUDA C 编程指南》学习笔记

《CUDA C 编程指南》学习笔记

时间:2022-10-13 18:55:06浏览次数:53  
标签:编程 并行 笔记 算法 图像处理 CUDA GPU CPU

CUDA是什么?

    CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。是一种通用并行计算架构,该架构使GPU能够解决复杂的计算问题。说白了就是我们可以使用GPU来并行完成像神经网络、图像处理算法这些在CPU上跑起来比较吃力的程序。通过GPU和高并行,我们可以大大提高这些算法的运行速度。有的同学可能知道,在CPU和GPU上跑同一个神经网络,由于其大量的浮点数权重计算以及可高并行化,其速度的差距往往在10倍左右,原本需要睡一觉才能看到的训练结果也许看两集动漫就OK了。

    GPU并行在图像处理方面更是应用广泛,大家知道图像处理实际上是对图像的二维矩阵进行处理,图像的尺寸都是几百乘几百的,很容易就是上万个像素的操作,随便搞个什么平滑算法,匹配算法等等的图像算法在CPU上跑个几十秒都是很正常的,对于图像处理,神经网络这种大矩阵计算,往往是可以并行化的,通过GPU并行化处理往往能够成倍的加速。

    综上所述,去学习一下怎么在GPU上开个几千个线程过把优化瘾还是一件很惬意的事情,更何况CUDA为我们提供了这么优秀的计算平台,可以直接使用C/C++写出在显示芯片上执行的程序,还是一件很赞的事情。

    不过CUDA编程需要注意的点是很多的,有很多因素如果忽略了会大大降低速度,写的不好的CUDA程序可能会比CPU程序还慢。所以优化和并行是一门很大的学问,需要我们去不断学习与了解。

关于本文

 

标签:编程,并行,笔记,算法,图像处理,CUDA,GPU,CPU
From: https://www.cnblogs.com/foreverstars/p/16789304.html

相关文章

  • 开工大吉 | 一图读懂《自动化工控工程师笔记本电脑使用现状》
    1关注到在《知乎》上每隔一段时间都会出现一个关于“自动化及相关专业笔记本电脑选择的问题”。为此我们调动圈内资源,发起了一次《自动化工控工程师笔记本电脑使用现状》的......
  • Java并发编程学习5-对象的组合
    对象的组合前面的博文,我们已经了解了关于线程安全和同步的一些基础知识。本篇博文将介绍一些线程安全的组合模式,来帮助我们确保使用这些模式开发的程序是线程安全的。1.......
  • 【笔记】最大公约数的一些性质
    裴蜀定理\[\foralla,b\in\mathbb{Z},\existsx,y\in\mathbb{Z},ax+by=\gcd(a,b)\]证明对于\(a_1=a_2=\cdots=a_n=0\),可以构造\(x_1=x_2=\cd......
  • docker容器整理笔记
    2022-10-091、docker学习1)性能更高,没有模拟层那个环节2)创建速度快只需要几秒钟,虚拟机创建至少好几分钟3)只能基于系统之上创建相同的容器系统2、很多软件安装在同一个系统......
  • libcudart.so.8.0 cannot open shared object file: N
    解决办法是将一些文件复制到/usr/local/lib文件夹下:#注意自己CUDA的版本号!sudocp/usr/local/cuda-8.0/lib64/libcudart.so.8.0/usr/local/lib/libcudart.so.8.0&&sudo......
  • AlexNet-文献阅读笔记
    论文介绍ImageNetClassificationwithDeepConvolutionalNeuralNetworks-AlexKrizhevsky,IlyaSutskever,andGeoffreyE.Hinton该论文是ImageNetLarge-Scale......
  • Python 学习笔记
    代码编写过程中的需要注意事项1.PEP是PythonEnhancementProposal的缩写,通常翻译为“Python增强提案”2.类总是使用驼峰格式命名,即所有单词首字母大写其余字母小写,类......
  • 基于STM32H7的ADS1256驱动案例,8通道,24bit ADC,带可编程增益(2021-09-20)
    例程下载:​​V7-068_ADS1256(8通道带PGA的24位ADC).7z​​(3.12MB)测试效果:测试LM285-2.5V稳压效果,抖动40uV:  测试干电池效果,抖动10uV左右,注意,这个级别的抖动容易受环境温......
  • k8s笔记2(Harbor)
    1、安装官方文档通过Helm部署Harbor(​​Harbordocs|DeployingHarborwithHighAvailabilityviaHelm(goharbor.io)​​)----->nodePort方式暴露服务;----->按提示填写c......
  • 《安富莱嵌入式周报》第278期:基于RUST编程语言RTOS,固态继电器芯片,微软发布物联网组件
    ​​​​ 本周更新一期视频教程DSP视频教程第10期:DSP运算加速的精髓,含SIMD指令,饱和运算指令和浮点以及定点的MAC乘累加指令(2022-08-14)视频版:​​https://www.bilibili.com/......