CPU和GPU

CPU和GPU

时间：2024-08-07 20:06:05浏览次数：11

标签：缓存访问内存延时 GPU CPU

CPU

提升CPU利用率1

在计算\(a + b\)之前，需要准备数据
- 主内存->L3缓存->L2缓存->L1缓存->CPU寄存器
- L1访问延时：0.5ns
- L2访问延时：7ns（\(14\times L1访问延时\)）
- L3访问延时：100ns（\(200\times L2访问延时\)）
提升空间和时间的内存本地性
- 时间：重用数据使得保持它们在缓存里
- 空间：减少读写数据使得可以预读取

样例分析

如果一个矩阵是按行存储，访问一行会比访问一列要快
- CPU一次读取64字节（缓存线）
- CPU会“聪明地”提前读取下一个缓存线

提升CPU利用率2

高端CPU有几十个核
- EC2 P3.16xlarge:2 Intel Xeon CPUs, 32 物理核
并行来利用所有核
- 超线程不一定提升性能，因为它们共享寄存器

样例分析

上面比下面慢

for i in range(len(a)):
    c[i] = a[i] + b[i]

c = a + b

上面调用了len(a)次+操作，而下面只调用了一次
右边很容易并行（例如下面的C++代码）

#pragma omp for 
for (i=0; i<a.size(); i++){
    c[i] =a[i] + b[i];
}

GPU

提升GPU利用率1

并行
- 使用数千个线程
内存本地性
- 缓存更小，架构更加简单
少用控制语句
- 支持有限
- 同步开销很大

CPU vs GPU

一般/高端

总结

CPU:可以处理通用计算。性能优化考虑数据读写效率和多线程
GPU:使用更多的小核和更好的内存带宽，适合能大规模并行的计算任务

标签：缓存,访问,内存,延时,GPU,CPU
From： https://www.cnblogs.com/codersgl-blog/p/18347815

【JVM基础19】——实践-CPU飙高排查方案和思路？
目录1-引言：2-⭐核心：2-1排查方案与思路3-小结：3-1如何排查CPU飙高问题？1-引言：CPU飙高指的是项目在运行过程中导致服务器的CPU内存占用较高。2-⭐核心：2-1排查方案与思路使用top命令查看占用CPU的情况top通过top命令查看后，可以查看是哪一个......
手机CPU性能天梯图（2024年8月），含安兔兔/GB6/3DMark跑分
原文地址（高清无水印原图/持续更新/含榜单出处链接）：2024年8月手机处理器天梯图2024年8月1日更新日志：由于近期并未有新处理器发布，故只做常规更新；移除鲁大师天梯图；补充其它天梯图数量。--------------分-割-线--------------2024年7月2日更新日志：由于篇幅有限，仅截部分（80-10......
第五代英特尔® 至强® 可扩展处理器： PK8072205560、PK8072205560x00 Gold 处理器可实
至强®可扩展处理器：第五代英特尔®至强®可扩展处理器采用内置英特尔®AIEngines，并具有与上一代相同的功率范围、软件和平台兼容性，可实现无与伦比的CPUAI性能。介绍英特尔®至强®Gold处理器英特尔®至强®Gold处理器针对要求严苛的AI、主流数据中心、多云计算......
735-基于3U VPX的AGX Xavier GPU计算主板
基于3UVPX的AGXXavierGPU计算主板一、板卡概述基于3UVPX的JetsonAGXXavier GPU计算主板是LINUX环境下软件开发等理想工具。拥有VPX标准连接器和特性的接口。是用于视频处理，相机信号，支持PCIE、USB、RS422、RS232、网口、SPI、I2C等综合......
主存储器与CPU的连接
连接原理主存容量的扩展分为位扩展法和字扩展法，位扩展法是要增加存储字长(将8个\(8K\times1\)位的存储芯片变成一个\(8K\times8\)位的存储芯片)。而字扩展法是对存储字的数量进行扩展(将4个\(16K\times8\)位的存储芯片变成一个\(64K\times8\)位的存储芯片)位扩展法......
CPU挖矿病毒解决方法
1症状CPU一半核心满载，断网负载消失，联网负载出现，htop、top、ps等无法查找到占用cpu进程。clamav慢扫全盘无结果。使用netstat-anptu找到一个德国ipProtoRecv-QSend-QLocalAddressForeignAddressStatePID/Programnametcp0294......
部署CPU与GPU通用的tensorflow：Anaconda环境
本文介绍在Anaconda环境中，下载并配置Python中机器学习、深度学习常用的新版tensorflow库的方法。在之前的两篇文章PythonTensorFlow深度学习回归代码：DNNRegressor与PythonTensorFlow深度神经网络回归：keras.Sequential中，我们介绍了利用Python中的tensorflow库，实现机器学......
笔记本CPU天梯图（2024年8月），含AMD/骁龙等新CPU
原文地址（高清无水印原图/持续更新/含榜单出处链接）：2024年8月笔记本CPU天梯图2024年8月笔记本CPU天梯图2024年8月5日更新日志：常规更新CinebenchR23、PassMark笔记本CPU天梯图，新增Geekbench6.2单核多核天梯图（Notebookcheck）；移除鲁大师天梯图。----------手动分割线------......
JAVA应用CPU跳点自动DUMP工具
背景在做系统监控时，CPU的使用率是一个关键的指标，它反映了系统的性能稳定性以及是否存在异常情况，能帮助我们了解系统的负载情况。通过监控CPU使用率，可以判断系统是否正常运行或者是否存在性能问题。如果CPU使用率过高，可能表示系统存在资源瓶颈，需要进行优化或升级。CPU监控的难......
性能测试瓶颈之CPU问题分析与调优
一、CPU的简介CPU概念：CPU（中央处理器：CentralProcessingUnit)，是一块超大规模的集成电路，是计算机的运算核心【拿到数据后先计算】和控制核心【然后再根据计算结果去控制】。功能：主要是解释计算机指令以及处理计算机软件中的数据。电脑中所有操作都由CPU负责读取指令，对指令译码并......

CPU

提升CPU利用率1

样例分析

提升CPU利用率2

样例分析

GPU

提升GPU利用率1

CPU vs GPU

总结

相关文章

赞助商

阅读排行