首页 > 其他分享 >高性能计算学习笔记(1)

高性能计算学习笔记(1)

时间:2024-10-06 23:22:03浏览次数:1  
标签:并行 矩阵 笔记 学习 算法 高性能 GPU 优化 CPU

一、程序优化

  1. CPU程序优化
    1.1 体系结构:CPU流水线技术、高速缓指令集、CPU超标量设计
    1.2 并行技术:MPI、OpenMP、SIMD、汇编
    1.3 算法:算法优化
  2. GPU程序优化
    1.1 GPU的体系结构(计算核心、高带宽、多级存储)
    1.2 GPU并行框架:CUDA、OpenCL、OpenACC
    1.3 并行设计的算法
  3. 程序优化核心
    3.1 算法并行可行性
    3.2 编写与体系结构相匹配的程序(并行效率、多级存储、指令集优化)

二、CPU和GPU区别

  1. CPU核心数量少,GPU核心数量多。
  2. CPU是减低延迟设计导向,GPU是增加数据吞吐量设计导向。
  3. CPU适合IO密集型任务,GPU适合数据计算任务。
  4. CPU切换线程有上下文代价,GPU线程几乎每个都有物理核心,线程切换零开销。

三、所有的机器学习和深度学习模型最基础的计算任务都是稀疏/稠密矩阵、集合基元。

四、稀疏矩阵向量乘问题(SpMV)

  1. 常见的稀疏矩阵储存方法有 COO、CSR、DIA(适合对角矩阵),通常CSR储存效率高些。
  2. CSR-SIMD优化,可变长的具有连续地址的非零元段,以段的形式对矩阵进行存储。

五、算法库

  1. BLAS/LAPACK 是基础的线性代数库
  2. PETSc C语言实现主要用来求解偏微方程组

标签:并行,矩阵,笔记,学习,算法,高性能,GPU,优化,CPU
From: https://www.cnblogs.com/anluo8/p/18449606

相关文章

  • prometheus学习笔记之PromQL
    prometheus学习笔记之PromQL一、PromQL语句简介官方文档:https://prometheus.io/docs/prometheus/latest/querying/basics/Prometheus提供⼀个函数式的表达式语⾔PromQL(PrometheusQueryLanguage),可以使⽤户实时地查找和聚合时间序列数据,表达式计算结果可以在图表中展示,也可......
  • Midjourney零基础学习
    Midjourney学习笔记TOP01什么是AI艺术AI艺术指的是使用AI技术创作的艺术作品,包括AI诗歌、AI音乐、AI绘画等多种艺术表现形式;AI艺术可以被视为计算机程序与人类合作创作作品;除了Midjourney,比较流行的AI图像生成工具还有StableDiffusion、Dall-E、Imagen、VQGAN+CLIP、Dre......
  • 国庆期间不停歇—学习ROS2第四天
    1.现在终端中创建文件其次在该文件目录下打开,最后在VS中创建两个文件夹,最后一个是src在终端中创建pkg,  ros2pkgcreatedemo_python_topic--build-typeament_python--dependenciesrclpyexample_interfaces--licenseApache-2.0ros2中创建功能包包的名字demo_py......
  • 十一放假不停歇—学习ROS第三天
    1.继承第一步:我们如果定义的类比较多,这里就会运用到子类继承父类的编程语言了,我们首先在包(demo_python_pkg)下面创建一个新的文件命名为write_node这个节点,开始写里面的程序,我们发现确实比较简略,fromdemo_python_pkg.person_nodeimportPersonNode#从包的节点文件中导入......
  • # 2024-2025-1 20241301 《计算机基础与程序设计》第二周学习总结
    这个作业属于哪个课程<2024-2025-1-计算机基础与程序设计>这个作业要求在哪里<2024-2025-1计算机基础与程序设计第一周作业>这个作业的目标<概括性地了解计算机系统,解决为什么要学习编程的问题>作业正文https://www.cnblogs.com/HonJo/p/18449597教材学习内......
  • 2024-2025-1计算机程序与设计第二周学习总结20241420姚金济
    <班级链接>(2024-2025-1-计算机基础与程序设计<作业要求链接>2024-2025-1计算机基础与程序设计第二周作业|作业正文|本博客链接教材学习内容总结(前者AI完成,后者自己完成,AI参考:kimi智能助手)计算机科学概论:由于文件内容较多,我将列出核心内容的概要:第1章全景图计算机系统:计算......
  • 2024-2025-1 20241428 《计算机基础与程序设计》第二周学习总结
    学期(2024-2025-1)学号20241428《计算机基础与程序设计》第2周学习总结作业信息|这个作业属于哪个课程|<班级的链接>(如2024-2025-1-计算机基础与程序设计)||这个作业要求在哪里||https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP/homework/13276))||这个作业的目标|数......
  • 2024-2025-1 20241320 《计算机基础与程序设计》第2周学习总结
    2024-2025-120241320《计算机基础与程序设计》第2周学习总结作业信息|这个作业属于哪个课程|https://www.cnblogs.com/rocedu/p/9577842.html|这个作业要求在哪里|https://www.cnblogs.com/rocedu/p/9577842.html#WEEK02|这个作业的目标|数字化信息安全自学教材《计算......
  • 2024-2025-1 20241316 《计算机基础与程序设计》第二周学习总结
    2024-2025-120241316《计算机基础与程序设计》第二周学习总结作业信息这个作业属于哪个课程2024-2025-1-计算机基础与程序设计这个作业要求在哪里2024-2025-1计算机基础与程序设计第二周作业这个作业的目标*自学教材计算机科学概论(第七版)第1章并完成云班课测试*......
  • 2024-2025 20241308《计算机基础与程序设计》第二周学习总结
    这个作业属于哪个课程https://edu.cnblogs.com/campus/besti/2024-2025-1-CFAP这个作业要求在哪里https://www.cnblogs.com/rocedu/p/9577842.html#WEEK02这个作业的目标阅读《计算机科学概论》和《C语言程序设计》的第一章内容并从中学习感悟,找到不懂的问题并想办法解决作......