首页 > 其他分享 >比较CPU和GPU中的矩阵计算

比较CPU和GPU中的矩阵计算

时间:2022-10-22 11:23:57浏览次数:75  
标签:Tensor 矩阵 顶配 CUDA GPU CPU

GPU 计算与 CPU 相比能够快多少?在本文中,我将使用 Python 和 PyTorch 线性变换函数对其进行测试。

以下是测试机配置:

CPU:英特尔 i7 6700k (4c/8t) GPU:RTX 3070 TI(6,144 个 CUDA 核心和 192 个 Tensor 核心) 内存:32G 操作系统:Windows 10

无论是cpu和显卡都是目前常见的配置,并不是顶配(等4090能够正常发货后我们会给出目前顶配的测试结果)

NVIDIA GPU 术语解释

CUDA 是Compute Unified Device Architecture的缩写。可以使用 CUDA 直接访问 NVIDIA GPU 指令集,与专门为构建游戏引擎而设计的 DirectX 和 OpenGL 不同,CUDA 不需要用户理解复杂的图形编程语言。但是需要说明的是CUDA为N卡独有,所以这就是为什么A卡对于深度学习不友好的原因之一。

Tensor Cores是加速矩阵乘法过程的处理单元。

例如,使用 CPU 或 CUDA 将两个 4×4 矩阵相乘涉及 64 次乘法和 48 次加法,每个时钟周期一次操作,而Tensor Cores每个时钟周期可以执行多个操作。

 

完整文章:

https://avoid.overfit.cn/post/a4e312b6f109444b9e27de31bf5a7b1d

标签:Tensor,矩阵,顶配,CUDA,GPU,CPU
From: https://www.cnblogs.com/deephub/p/16815639.html

相关文章

  • 面向显式反馈的基于矩阵分解的推荐算法PMF
    论文:RuslanSalakhutdinovandAndriyMnih.ProbabilisticMatrixFactorization[C].NeurIPS2007.https://proceedings.neurips.cc/paper/2007/file/d7322ed717dedf1e......
  • Normal Matrix(法向量变换矩阵)
    我们都知道gl的坐标系统。它的工作是将坐标从一个坐标系转到另一个坐标系。其中我们用到了几个转换矩阵。其中最为重要的是模型(Model)、视图(View)、投影(Projection)三个矩阵。......
  • ZABBIX监控操作系统top10(CPU)
    脚本如下:#!/bin/sh####################################################usedtoCollectionCPUTop10Informatiom#scriptbyshell#writedbyDeliver#huchangxi......
  • 有哪些好用的深度学习的GPU云服务器平台?
    ​​​​简单来说,如果你是长期使用GPU服务器,建议选择带显卡的硬件服务器,综合性能也比较好。如果是用来进行短周期或者临时使用,建议租用云服务器,既方便又快捷,可按需购买,可以......
  • 有哪些好用的深度学习的GPU云服务器平台?
    ​​​​简单来说,如果你是长期使用GPU服务器,建议选择带显卡的硬件服务器,综合性能也比较好。如果是用来进行短周期或者临时使用,建议租用云服务器,既方便又快捷,可按需购买,可以......
  • 广义矩阵乘法中二元运算符的条件
    一般地,如果矩阵中的加法和乘法满足一个半环,那么矩阵乘法满足交换律。一个半群由集合\(A\)和两个定义在\(A\)上的二元运算\(\oplus\)和\(\otimes\)构成,其中:\((A......
  • 存储器与CPU的连接
    存储器与CPU连接分主要看前五步1.首先根据给出的地址范围写出二进制码2.确定芯片的类型和数量3.确定地址线4.确定片选信号要注意MREQ是低电平有效,要连到138译码器......
  • gpu/cpu类型deployment清单整理脚本
    #!/bin/bashkubectlgetdeploy-nhost|grep-v'0'|awk'{print$1}'>deploy.txtfordeployin`catdeploy.txt`docheck_gpu=`kubectldescribedepl......
  • 矩阵连乘最小相乘次数的思想
    矩阵的乘法矩阵的概念来自线性代数矩阵乘法:只有当左边矩阵的列数等于右边矩阵的行数时,它们才可以相乘。结果为前一个矩阵的行元素×后一个矩阵的列元素  矩阵相......
  • CPU密集型和IO密集型(判断最大核心线程的最大线程数)
    CPU密集型和IO密集型(判断最大核心线程的最大线程数)CPU密集型1.CPU密集型获取电脑CPU的最大核数,几核,最大线程数就是几Runtime.getRuntime().availableProcessors()--->......