首页 > 其他分享 >深度学习显卡的选择

深度学习显卡的选择

时间:2023-04-20 11:36:29浏览次数:33  
标签:显存 NLP 深度 学习 GPU 显卡 算力 CV

深度学习显卡的选择:

1、选择算力在5.0以上的

在GPU算力高于5.0时,可以用来跑神经网络。算力越高,计算能力越强。

2、尽量选择大显存

显存越高,意味着性能越强悍。特别是对于CV领域。

3、GPU几个重要的参数

显存带宽:代表GPU芯片每秒与显存交换的数据大小,这个值等于显存位宽*工作频率,单位为GB/秒,该值越大,代表GPU性能越好。

显存位宽:代表GPU芯片每个时钟周期内能从GPU显存中读取的数据大小,这个值越大代表GPU芯片和显存之间数据交换的速度越快,性能越好。

GPU工作频率:代表GPU每秒钟工作次数,单位为MHz,跟CPU的频率类似。该值越大代表性能越好。

CUDA核心数量:CUDA核心数量越大越好,

 

显卡算力:

显卡类别

显存

Cuda核心数

显存位宽(bit)

显卡支持的算力

CV

NLP

3090ti

24G

10752

384

8.6

(升腾910)~A100

 

 

 

~8.0

 

 

(T4)

16G

2560

256

7.5

升腾910NPU)

32G

 

 

-

√(部分限制)

×

(A40)

48G

10752

384

 

(RTX Titan)

24G

4608

384

7.5

(V100)

32G

5120

4096

7.0

 

 

 

显卡类别

性能

3090ti

 

显卡 :3090ti 目前英伟达旗下性能排行第三。

 

支持NLP

支持CV

超聚变atlas800-9000(升腾910)

相关资料较少。与英伟达A100算力相当

A100显存:40G/80G

 

超聚变G5500(T4)

显卡:Tesla T4

 

支持NLP

支持CV

华为atlas800-9000(升腾910NPU)

 

显卡:升腾910NPU

显存:32G

 

Atlas 800 训练服务器(型号:9000)是基于华为鲲鹏920+昇腾910处理器的AI训练服务器,具有最强算力密度、超高能效与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练。

 

NLP:目前npu对LSTM与GRU支持不行,不建议使用LSTM和GRU网络在npu上运行。

CV:视觉精度会有所损失,并且在训练和推理过程中加载会缓慢,不支持部分pytorch函数。

宝德pr4906(A40)

 

A40显卡

与 NVIDIA 上一代旗舰 V100 GPU 相当。

 

支持NLP

支持CV

宝德pr2910(T4)

 

同上 T4

宝德4906(RTX Titan)

RTX Titan

 

支持NLP

支持CV

G5500-560(V100)

 

V100

NVIDIA® V100 Tensor Core GPU

可在单个 GPU 中提供近 32 个 CPU 的性能, V100 已在业界首个 AI 基准测试 MLPerf 中拔得头筹,以出色的成绩证明了其是具有巨大可扩展性和通用性的当今世界上强大的计算平台。

 

支持NLP

支持CV

 

 

标签:显存,NLP,深度,学习,GPU,显卡,算力,CV
From: https://www.cnblogs.com/2016-zck/p/17336152.html

相关文章

  • stm32f407的学习
    最近的学习:运用hal库驱动了AD9854信号源,不过信号过一会儿不是很稳定学到了串口打印实现了ADC的调试,其中由于时钟的调试不对,显示乱码问题,改了两个文件的hse_value为8000000就行了学会了oled屏幕的显示,包括汉字显示,用到了点阵工具等在学oled浮点显示出adc的值,还没成功。......
  • windows server 的日志手动筛选xml如何学习编写
    如何编写WindowsServer的日志筛选器,你需要先了解以下概念:1、WindowsEventLog:WindowsEventLog是WindowsServer操作系统提供的一种记录系统事件的机制,它可以记录操作系统、应用程序、安全、系统和其他类型的事件。2、EventViewer:EventViewer是Windows操作系统提供......
  • python+playwright 学习-54 结合 gremlins.js 实现web 网页的mokey测试
    前言在Android应用测试里面有个mokey测试可以对app做稳定性的测试,在app里面随机乱点发送一些事件,看app会不会异常。这种做法,也称为Monkey测试或Fuzz测试,在移动应用程序开发中非常常见。Gremlins.js模拟随机用户操作:gremlins单击窗口中的任意位置,在表格中输入随机数......
  • docker基本命令学习
    Docker神器的使用原创 生信小尧 生信小尧 2023-02-2117:42 发表于广东收录于合集#linux5个 点击蓝字关注我们  什么是Docker?Docker是一个开源的应用容器引擎诞生于2013年初,基于Go语言实现,dotCloud公司出品(后改名为DockerInc)Docker可以让开发......
  • Spring Aop的学习:Spring Aop的简单入门
    1.什么是AOPAOP(AspectOrientedProgramming):面向切面编程,是OOP(面向对象编程)的一个延续,其和OOP一样,也是一种编程思想。不过AOP是一种横向开发模式。 2.AOP的作用及应用场景作用AOP的主要作用就是减少代码量,提高代码的可重用性,有利于未来的可操作性与可维护性。主要操......
  • Python数据挖掘之关联规则学习
    一、关联算法应用介绍关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。常见于与购物篮分析。常用关联算法表如下,简单理解的话,就是测算某几项东西一起出现的概率。比如:如果测算得出,大量订单中出......
  • 机器学习基础
    机器学习中的关键组件可以用来学习的数据(data);如何转换数据的模型(model);模型用来消化数据;一个目标函数(objectivefunction),用来量化模型的有效性,判断是否达到目标;调整模型参数以优化目标函数的算法(algorithm)。数据由数据集组成,数据集==样本集合,每个样本都有一组称......
  • Gin学习笔记-A
    fresh包可以实现预加载预定义函数预定义的全局函数,用在html文件中and函数返回它的第一个empty参数或者最后一个参数就是说"andxy"等价于"ifxthenyelsex":所有参数都会执行or返回第一个非empty参数或者最后一个参数亦"orxy"等价于"ifxthenxelsey":所有参......
  • 4月19日map和multimap以及AVL树的学习
    map的插入比较繁琐,但是用方括号运算符就可以直接插入。也可以用方括号查找键的位置并且用它的返回值来修改值。同样map也可以用迭代器来遍历。map头文件中还有一个multimap关键字,他与map不同点在于它可以存入键相同的键值对,以应对某些情况。给定一个单词列表 words 和一个整数......
  • 学习C语言的第八天
    由于个人的拖拉原因,时隔一周继续更新博客,记录学习。一.结构体1.1为什么要用结构体1.2定义一个结构体编程习惯要求大写开头structStudent{intnum;charname[32];charsex;intage;doublescore;charaddr[......