CUDA是什么？

CUDA(Compute Unified Device Architecture)，是显卡厂商NVIDIA推出的运算平台。是一种通用并行计算架构，该架构使GPU能够解决复杂的计算问题。说白了就是我们可以使用GPU来并行完成像神经网络、图像处理算法这些在CPU上跑起来比较吃力的程序。通过GPU和高并行，我们可以大大提高这些算法的运行速度。有的同学可能知道，在CPU和GPU上跑同一个神经网络，由于其大量的浮点数权重计算以及可高并行化，其速度的差距往往在10倍左右，原本需要睡一觉才能看到的训练结果也许看两集动漫就OK了。

GPU并行在图像处理方面更是应用广泛，大家知道图像处理实际上是对图像的二维矩阵进行处理，图像的尺寸都是几百乘几百的，很容易就是上万个像素的操作，随便搞个什么平滑算法，匹配算法等等的图像算法在CPU上跑个几十秒都是很正常的，对于图像处理，神经网络这种大矩阵计算，往往是可以并行化的，通过GPU并行化处理往往能够成倍的加速。

综上所述，去学习一下怎么在GPU上开个几千个线程过把优化瘾还是一件很惬意的事情，更何况CUDA为我们提供了这么优秀的计算平台，可以直接使用C/C++写出在显示芯片上执行的程序，还是一件很赞的事情。

不过CUDA编程需要注意的点是很多的，有很多因素如果忽略了会大大降低速度，写的不好的CUDA程序可能会比CPU程序还慢。所以优化和并行是一门很大的学问，需要我们去不断学习与了解。

关于本文

标签：编程,并行,笔记,算法,图像处理,CUDA,GPU,CPU
From： https://www.cnblogs.com/foreverstars/p/16789304.html

开工大吉 | 一图读懂《自动化工控工程师笔记本电脑使用现状》
1关注到在《知乎》上每隔一段时间都会出现一个关于“自动化及相关专业笔记本电脑选择的问题”。为此我们调动圈内资源，发起了一次《自动化工控工程师笔记本电脑使用现状》的......
Java并发编程学习5-对象的组合
对象的组合前面的博文，我们已经了解了关于线程安全和同步的一些基础知识。本篇博文将介绍一些线程安全的组合模式，来帮助我们确保使用这些模式开发的程序是线程安全的。1.......
【笔记】最大公约数的一些性质
裴蜀定理\[\foralla,b\in\mathbb{Z},\existsx,y\in\mathbb{Z},ax+by=\gcd(a,b)\]证明对于\(a_1=a_2=\cdots=a_n=0\)，可以构造\(x_1=x_2=\cd......
docker容器整理笔记
2022-10-091、docker学习1)性能更高，没有模拟层那个环节2）创建速度快只需要几秒钟，虚拟机创建至少好几分钟3）只能基于系统之上创建相同的容器系统2、很多软件安装在同一个系统......
libcudart.so.8.0 cannot open shared object file: N
解决办法是将一些文件复制到/usr/local/lib文件夹下：#注意自己CUDA的版本号！sudocp/usr/local/cuda-8.0/lib64/libcudart.so.8.0/usr/local/lib/libcudart.so.8.0&&sudo......
AlexNet-文献阅读笔记
论文介绍ImageNetClassificationwithDeepConvolutionalNeuralNetworks-AlexKrizhevsky,IlyaSutskever,andGeoffreyE.Hinton该论文是ImageNetLarge-Scale......
Python 学习笔记
代码编写过程中的需要注意事项1.PEP是PythonEnhancementProposal的缩写，通常翻译为“Python增强提案”2.类总是使用驼峰格式命名,即所有单词首字母大写其余字母小写,类......
基于STM32H7的ADS1256驱动案例，8通道，24bit ADC，带可编程增益(2021-09-20)
例程下载：V7-068_ADS1256（8通道带PGA的24位ADC）.7z(3.12MB)测试效果：测试LM285-2.5V稳压效果，抖动40uV：测试干电池效果，抖动10uV左右，注意，这个级别的抖动容易受环境温......
k8s笔记2(Harbor)
1、安装官方文档通过Helm部署Harbor（Harbordocs|DeployingHarborwithHighAvailabilityviaHelm(goharbor.io)）----->nodePort方式暴露服务；----->按提示填写c......
《安富莱嵌入式周报》第278期：基于RUST编程语言RTOS，固态继电器芯片，微软发布物联网组件
本周更新一期视频教程DSP视频教程第10期：DSP运算加速的精髓，含SIMD指令，饱和运算指令和浮点以及定点的MAC乘累加指令（2022-08-14）视频版：https://www.bilibili.com/......

《CUDA C 编程指南》学习笔记

CUDA是什么？

关于本文

相关文章

赞助商

阅读排行