首页 > 其他分享 >CPU和GPU

CPU和GPU

时间:2024-08-07 20:06:05浏览次数:11  
标签:缓存 访问 内存 延时 GPU CPU

CPU

img

提升CPU利用率1

  • 在计算\(a + b\)之前,需要准备数据
    • 主内存->L3缓存->L2缓存->L1缓存->CPU寄存器
    • L1访问延时:0.5ns
    • L2访问延时:7ns(\(14\times L1访问延时\))
    • L3访问延时:100ns(\(200\times L2访问延时\))
  • 提升空间和时间的内存本地性
    • 时间:重用数据使得保持它们在缓存里
    • 空间:减少读写数据使得可以预读取

样例分析

  • 如果一个矩阵是按行存储,访问一行会比访问一列要快
    • CPU一次读取64字节(缓存线)
    • CPU会“聪明地”提前读取下一个缓存线

img

提升CPU利用率2

  • 高端CPU有几十个核
    • EC2 P3.16xlarge:2 Intel Xeon CPUs, 32 物理核
  • 并行来利用所有核
    • 超线程不一定提升性能,因为它们共享寄存器

样例分析

  • 上面比下面慢
for i in range(len(a)):
    c[i] = a[i] + b[i]
c = a + b
  • 上面调用了len(a)+操作,而下面只调用了一次
  • 右边很容易并行(例如下面的C++代码)
#pragma omp for 
for (i=0; i<a.size(); i++){
    c[i] =a[i] + b[i];
}

GPU

img

提升GPU利用率1

  • 并行
    • 使用数千个线程
  • 内存本地性
    • 缓存更小,架构更加简单
  • 少用控制语句
    • 支持有限
    • 同步开销很大

CPU vs GPU

一般/高端

img

总结

  • CPU:可以处理通用计算。性能优化考虑数据读写效率和多线程
  • GPU:使用更多的小核和更好的内存带宽,适合能大规模并行的计算任务

标签:缓存,访问,内存,延时,GPU,CPU
From: https://www.cnblogs.com/codersgl-blog/p/18347815

相关文章

  • 【JVM基础19】——实践-CPU飙高排查方案和思路?
    目录1-引言:2-⭐核心:2-1排查方案与思路3-小结:3-1如何排查CPU飙高问题?1-引言:CPU飙高指的是项目在运行过程中导致服务器的CPU内存占用较高。2-⭐核心:2-1排查方案与思路使用top命令查看占用CPU的情况top通过top命令查看后,可以查看是哪一个......
  • 手机CPU性能天梯图(2024年8月),含安兔兔/GB6/3DMark跑分
    原文地址(高清无水印原图/持续更新/含榜单出处链接):2024年8月手机处理器天梯图2024年8月1日更新日志:由于近期并未有新处理器发布,故只做常规更新;移除鲁大师天梯图;补充其它天梯图数量。--------------分-割-线--------------2024年7月2日更新日志:由于篇幅有限,仅截部分(80-10......
  • 第五代英特尔® 至强® 可扩展处理器: PK8072205560、PK8072205560x00 Gold 处理器可实
    至强®可扩展处理器:第五代英特尔®至强®可扩展处理器采用内置英特尔®AIEngines,并具有与上一代相同的功率范围、软件和平台兼容性,可实现无与伦比的CPUAI性能。介绍英特尔®至强®Gold处理器英特尔®至强®Gold处理器针对要求严苛的AI、主流数据中心、多云计算......
  • 735-基于3U VPX的AGX Xavier GPU计算主板
    基于3UVPX的AGXXavierGPU计算主板 一、板卡概述     基于3UVPX的JetsonAGXXavier GPU计算主板是LINUX环境下软件开发等理想工具。拥有VPX标准连接器和特性的接口。是用于视频处理,相机信号,支持PCIE、USB、RS422、RS232、网口、SPI、I2C等综合......
  • 主存储器与CPU的连接
    连接原理主存容量的扩展分为位扩展法和字扩展法,位扩展法是要增加存储字长(将8个\(8K\times1\)位的存储芯片变成一个\(8K\times8\)位的存储芯片)。而字扩展法是对存储字的数量进行扩展(将4个\(16K\times8\)位的存储芯片变成一个\(64K\times8\)位的存储芯片)位扩展法......
  • CPU挖矿病毒解决方法
    1症状CPU一半核心满载,断网负载消失,联网负载出现,htop、top、ps等无法查找到占用cpu进程。clamav慢扫全盘无结果。使用netstat-anptu找到一个德国ipProtoRecv-QSend-QLocalAddressForeignAddressStatePID/Programnametcp0294......
  • 部署CPU与GPU通用的tensorflow:Anaconda环境
      本文介绍在Anaconda环境中,下载并配置Python中机器学习、深度学习常用的新版tensorflow库的方法。  在之前的两篇文章PythonTensorFlow深度学习回归代码:DNNRegressor与PythonTensorFlow深度神经网络回归:keras.Sequential中,我们介绍了利用Python中的tensorflow库,实现机器学......
  • 笔记本CPU天梯图(2024年8月),含AMD/骁龙等新CPU
    原文地址(高清无水印原图/持续更新/含榜单出处链接):2024年8月笔记本CPU天梯图2024年8月笔记本CPU天梯图2024年8月5日更新日志:常规更新CinebenchR23、PassMark笔记本CPU天梯图,新增Geekbench6.2单核多核天梯图(Notebookcheck);移除鲁大师天梯图。----------手动分割线------......
  • JAVA应用CPU跳点自动DUMP工具
    背景在做系统监控时,CPU的使用率是一个关键的指标,它反映了系统的性能稳定性以及是否存在异常情况,能帮助我们了解系统的负载情况。通过监控CPU使用率,可以判断系统是否正常运行或者是否存在性能问题。如果CPU使用率过高,可能表示系统存在资源瓶颈,需要进行优化或升级。CPU监控的难......
  • 性能测试瓶颈之CPU问题分析与调优
    一、CPU的简介CPU概念:CPU(中央处理器:CentralProcessingUnit),是一块超大规模的集成电路,是计算机的运算核心【拿到数据后先计算】和控制核心【然后再根据计算结果去控制】。功能:主要是解释计算机指令以及处理计算机软件中的数据。电脑中所有操作都由CPU负责读取指令,对指令译码并......