GPU的Fermi 架构与Kepler架构杂谈

时间：2024-08-29 12:36:38浏览次数：13

标签：线程架构 10 Kepler Fermi SM GPU

Fermi 架构 Fermi架构是第一个完整的GPU架构，如图10-15所示。图10-15 Fermi架构是第一个完整的GPU架构 Fermi架构逻辑图，如图10-15所示，具体数据如下: 1）512个加速核心，CUDA核 2）每个CUDA核心都有一个全流水线的整数算数逻辑单元ALU，和一个浮点数运算单元FPU 3）CUDA核被组织到16个SM上 4）6个384-bits的GDDR5 的内存接口 5）支持6G的全局机栽内存 6）GigaThread疫情，分配线程块到SM线程束调度器上 7）768KB的二级缓存，被所有SM共享而SM则包括下面这些资源： 1）执行单元（CUDA核） 2）调度线程束的调度器和调度单元 3）共享内存，寄存器文件和一级缓存每个多处理器SM有16个加载/存储单元，所以每个时钟周期内有16个线程（半个线程束）计算源地址和目的地址。特殊功能单元SFU执行固有指令，如正弦，余弦，平方根和插值，SFU在每个时钟周期内的每个线程上执行一个固有指令。
    每个SM有两个线程束调度器，和两个指令调度单元，当一个线程块被指定给一个SM时，线程块内的所有线程被分成线程束，两个线程束选择其中两个线程束，在用指令调度器存储两个线程束要执行的指令（就像上面例子中分水果的水果一样，这里有两个班，两个班的老师各自控制的自己的水果，老师就是指令调度器）
    像第一张图上的显示一样，每16个CUDA核心为一个组，还有16个加载/存储单元或4个特殊功能单元。当某个线程块被分配到一个SM上的时候，会被分成多个线程束，线程束在SM上交替执行，如图10-16所示。图10-16 warp指令与调度交替执行架构每个线程束在同一时间执行同一指令，同一个块内的线程束互相切换是没有时间消耗的。
    Fermi上支持同时并发执行内核。并发执行内核允许执行一些小的内核程序来充分利用GPU，如图10-17所示。图10-17 Fermi上支持同时并发执行内核架构 10.5.9 Kepler架构 Kepler架构作为Fermi架构的后代，有以下技术突破： 1）强化的SM 2）动态并行 3）Hyper-Q技术技术参数也提高了不少，比如单个SM上CUDA核的数量，SFU的数量，LD/ST的数量等，如图10-18以及如图10-19所示。图10-18 Kepler架构作为Fermi架构的后代，内存性能提升图10-19 Kepler架构作为Fermi架构的后代，数据交互性能提升 kepler架构的最突出的一个特点就是内核可以启动内核了，这使得可以使用GPU完成简单的递归操作，流程如图10-20所示。图10-20 kepler内核启动内核，使用GPU完成简单的递归操作 Hyper-Q技术主要是CPU和GPU之间的同步硬件连接，以确保CPU在GPU执行的同事做更多的工作。Fermi架构下CPU控制GPU只有一个队列，Kepler架构下可以通过Hyper-Q技术实现多个队列，如图10-21所示。计算能力概览：
图10-21 Kepler架构下可以通过Hyper-Q技术实现多个队列

标签：线程,架构,10,Kepler,Fermi,SM,GPU
From： https://www.cnblogs.com/wujianming-110117/p/18386448

领域驱动设计（DDD）的几种典型架构介绍
领域驱动设计（DDD）的几种典型架构介绍平常工作中都听说了DDD，也对DDD做定程度的了解，那么怎么将一个新项目从头开始按照DDD的过程进行划分与架构设计呢？一、专业术语各种服务IAAS：基础设施服务，Infrastructure-as-a-servicePAAS：平台服务，Platform-as-a-serviceSAAS：软件服务，Softwa......
计算机架构设计的8个伟大思想
“Theseareeightgreatideasthatcomputerarchitectshaveinventedinthelast60yearsofcomputerdesign.Theyaresopowerfultheyhavelastedlongafterthefirstcomputerthatusedthem,withnewerarchitectsdemonstratingtheiradmirationbyimitat......
如何驱动企业数字化转型的敏捷企业的创新实践指南：敏捷企业架构的制胜之道
敏捷企业架构如何引领企业转型变革在全球化与数字化交织的新时代，企业正处于前所未有的变革浪潮中。传统的企业架构方式已经难以应对瞬息万变的市场需求和技术革新。作为一种突破性解决方案，敏捷企业架构提供了一个灵活且强大的框架，帮助企业在动态环境中保持竞争优势，迅速响应市......
从战略到执行：解密敏捷企业架构的变革之道，助力企业未来增长
敏捷企业架构的新时代与变革契机在数字化转型浪潮中，企业正面临前所未有的市场挑战与技术机遇。传统企业架构（EnterpriseArchitecture,EA）虽然能够为企业提供稳定的战略支持，但其应对市场快速变化的能力不足。而敏捷方法（Agile）以其高效迭代和灵活性，正在迅速改变企业的运营方式。......
全面解读敏捷企业架构的落地策略，助力企业实现数字化转型
敏捷企业架构如何推动企业转型成功在当今迅速变化的商业环境中，企业面对的最大挑战之一是如何快速适应市场变化并保持竞争力。传统的企业架构虽然在稳定性和可控性方面具备优势，但在面对数字化转型的浪潮时，显得僵化且反应迟缓。敏捷企业架构通过引入敏捷方法的灵活性和迭代性，为......
架构师面试题 - Spring Boot 面试专题（33题含答案）
目录前言1、什么是springboot2、什么是JavaConfig？3、SpringBoot有哪些优点？答：4、SpringBoot提供了哪些核⼼功能？5、如何重新加载SpringBoot上的更改，⽽⽆需重新启动服务器？6、创建⼀个SpringBootProject的最简单的⽅法是什么？7、运⾏SpringBoot有哪......
大模型提示词工程技术4-提示词架构设计,包括：TAG框架,TRACE框架,ICIO框架
大模型提示词工程技术4-提示词架构设计,包括：TAG框架,TRACE框架,ICIO框架。《大模型提示词工程技术》的作者：微学AI，这是一本专注于提升人工智能大模型性能的著作，它深入浅出地讲解了如何通过优化输入提示词来引导大模型生成高质量、准确的输出。书中不仅涵盖了提示词工程的基本......
并行动力：用PyTorch在多GPU上释放深度学习潜能
标题：并行动力：用PyTorch在多GPU上释放深度学习潜能随着深度学习模型变得越来越复杂，单GPU训练往往难以满足需求。幸运的是，PyTorch提供了强大的多GPU训练支持，允许我们利用多个GPU来加速模型的训练过程。本文将详细介绍如何在PyTorch中使用多GPU训练，包括数据并行、模型并行以及......
深入解析VLAN：现代网络架构的关键技术
一、什么是VLAN？VLAN（virtuallocalAreaNetwork）虚拟局域网，是将一个物理的LAN在逻辑上划分成多个广播域的通信技术。每个VLAN是一个广播域，VLAN内的主机间可以直接通信，而VLAN之间不能直接互通。这样，广播报文就被限制在了一个VLAN内。二、为什么需要VLAN？早期的以太网是一......
Android 常用的性能分析工具详解：GPU呈现模式
此篇将重点介绍几种常用的Android性能分析工具：一、Logcat日志选取Tag＝ActivityManager，可以粗略地知道界面Displaying的时间消耗。当我们打开一个Activity的时候，log会打印一串log如下：I/ActivityManager﹕Displayedxxx.xxx.xxx/TestActivity:+1s272ms(total+3s843ms)第一......

GPU的Fermi 架构与Kepler架构杂谈

相关文章

赞助商

阅读排行