英伟达A100、A800、H100、H800、V100以及RTX 4090的详细性能参数对比

时间：2024-06-11 14:02:19浏览次数：26

标签：显存伟达 4090 H800 A100 功耗接口 H100 RTX

英伟达A100、A800、H100、H800、V100以及RTX 4090的详细性能参数对比：

英伟达A100

架构与制程：
- 架构：Ampere
- 制程：7纳米
核心与频率：
- CUDA核心数：6912个
- Tensor核心数：432个
- Boost时钟频率：1.41 GHz
性能：
- FP32性能：19.5 TFLOPS
- FP64性能：9.7 TFLOPS
- Tensor性能：624.6 TFLOPS
内存：
- 显存容量：提供40GB和80GB HBM2e两种版本
- 内存带宽：高达2 TB/s（80GB版本）
功耗与接口：
- TDP：400W
- 支持的PCIe版本：PCIe 4.0
其他特性：
- 支持NVIDIA GPU Boost技术
- 配备第三代NVLink互连技术和第二代NVSwitch交换机
- 支持RTX加速器，实现实时光线追踪渲染等功能

英伟达A800

数据传输速率：400GB/s（相比A100的600GB/s有所降低）
CUDA核心：拥有10.752个CUDA核心（注意：不同来源可能提供不同数据）
显存：
- 类型：HBM2e显存
- 容量：80GB
- 位宽：5120bit
- 带宽：最高达2TB/s
接口类型：PCI Express 4.0接口
制造工艺：基于7纳米工艺，搭载GA100图形处理器
功耗：最大功耗约为300瓦

英伟达H100

架构：Hopper架构
CUDA核心数：14592个
性能：
- 张量处理能力：高达1.8万亿次/秒
- FP8张量性能：840 TFLOPS
显存：
- 类型：HBM3显存技术
- 容量：高达64GB（注意：可能存在其他配置）
- 带宽：高达3TB/s
制程技术：台积电四纳米工艺
互联技术：
- 支持PCIe 5.0技术
- 数据传输速度高达128GB/s
- 支持NVLink 8.0技术

英伟达H800

带宽限制：由于美国出口管制，带宽上限被设定为600 GB/s
显存：
- 类型与容量：可能是80GB HBM2e或GDDR6（具体规格可能依据不同的市场和配置而异）
接口：提供高速PCIe接口（可能是PCIe 4.0）
功耗：未给出具体数值，但预期在合理范围内以保证能效比

英伟达V100

核心代号：GV100
核心频率：
- 基础频率：1245 MHz
- Turbo频率：1380 MHz
CUDA核心：5120个
显存：
- 类型：HBM2
- 容量：16 GB
- 带宽：897.0 GB/s
性能：
- FP16性能：28.26 TFLOPS (2:1)
- FP32性能：14.13 TFLOPS
- FP64性能：7.066 TFLOPS (1:2)
功耗：TDP功耗300W

英伟达RTX 4090

架构：Ada Lovelace架构
核心频率：
- 基础核心频率：2230~2520MHz
- Turbo频率：可能达到更高值
CUDA核心：16384个
显存：
- 容量：24GB
- 类型：GDDR6X
- 位宽：384bit
- 显存频率：高达21000 MHz
- 性能：
  - 支持DirectX12 Ultimate (12_2)，提供硬件光线追踪和可变速率着色支持
  - 引入第三代光线追踪核心和第四代Tensor内核，显著提升光线追踪和AI辅助渲染性能
- 接口：
  - 采用PCI Express 4.0 16X接口
  - I/O接口包括1个HDMI接口和3个DisplayPort接口
- 散热与供电：
  - 散热方式采用涡轮风扇，确保显卡在高负荷运行时也能保持稳定的温度
  - 公版供电为8-pin EPS
- 其他参数：
  - 最大分辨率支持7680×4320，满足高分辨率显示需求
  - 显卡类型定位为发烧级，适用于高端游戏和图形工作站
- 汇总对比
- 架构与制程：
  - A100和H100分别基于Ampere和Hopper架构，采用先进的7纳米和4纳米制程技术。
  - RTX 4090采用Ada Lovelace架构，制程技术未具体提及。
  - V100使用GV100核心，制程技术未具体提及。
  - A800和H800作为定制版本，其架构和制程可能与A100和H100相似，但受到出口管制影响，性能有所限制。
- CUDA核心与性能：
  - H100拥有最多的CUDA核心数（14592个），其次是A100（6912个）和RTX 4090（16384个）。
  - 性能上，H100和A100在深度学习等AI任务中表现出色，而RTX 4090则在图形渲染和游戏性能方面领先。
- 显存与带宽：
  - A100和H100提供高容量HBM2e和HBM3显存，带宽分别高达2 TB/s和3 TB/s。
  - RTX 4090使用GDDR6X显存，容量为24GB，带宽相对较低。
  - A800和H800的显存和带宽受限于出口管制。
- 功耗与接口：
  - A100和RTX 4090功耗较高（分别为400W和TDP未具体提及），但提供高效的PCIe 4.0接口。
  - H100功耗未具体提及，但支持PCIe 5.0接口，提供更高的数据传输速度。
  - V100功耗为300W，接口技术未具体提及。
  - A800和H800的功耗和接口信息未详细提供。
- 特殊功能与应用场景：
  - A100和H100适用于深度学习、高性能计算和数据中心等场景。
  - RTX 4090专注于游戏、图形渲染和AI辅助创作等应用。
  - V100也适用于深度学习和其他高性能计算任务。
  - A800和H800作为定制版本，其应用场景受限于出口管制。
- 请注意，以上信息基于当前可获得的数据和规格，实际性能可能因配置、驱动和应用程序优化等因素而有所变化。

标签：显存,伟达,4090,H800,A100,功耗,接口,H100,RTX
From： https://blog.csdn.net/2402_84466582/article/details/139523426

反超苹果！英伟达市值突破 3w 亿美元，跃居全球第二位
2009年，苹果的笔记本电脑搭载的就是英伟达的芯片，但那个时候，英伟达的芯片封装工艺存在缺陷，导致苹果的笔记本电脑在长期运行时会温度过高，甚至出现闪屏、白屏的现象。事出之后，由于英伟达不愿承担责任，一气之下的苹果联合戴尔等公司把英伟达告了，英伟达这才同意更换有缺陷的芯片组。......
鲜为人知的英伟达创始人：早早退出，身价不如黄仁勋零头
内容提要普里姆因为婚姻纠纷等个人生活的干扰无法专注在工作上，在成立公司的10年后，也就是2003年宣布退休离开英伟达，并在2006年出售剩余的所有英伟达股份，过上不与外界联系、离群索居的生活，在家中鼓捣着如何“拯救地球”的宣言。文章内容英伟达（NVIDIA）如今无疑是AI领域最为关键......
算力天天说：英伟达创始人兼CEO黄仁勋在演讲中宣布Blackwell芯片已开始投产
算力国际新闻概述如下：英伟达算力芯片新进展：英伟达创始人兼CEO黄仁勋在演讲中宣布，英伟达的最新AI算力芯片——Blackwell芯片已开始投产。英伟达预计B系列芯片将在今年带来大量营收，这意味着国内相关英伟达算力产业链公司可能会更早确认业绩。此外，英伟达还计划在2025年推出Bl......
英伟达（NVIDIA）、AMD和Intel部分GPU性能参数对比
当然，以下是对NVIDIA、AMD和Intel部分GPU型号更为详细的性能参数对比，以及对它们的市场应用和技术创新的概述。NVIDIAGPU1.NVIDIAH100CUDA核心数：数千个（具体数量根据型号配置有所不同）TensorCore数：数百个（为深度学习提供强大的加速能力）显存容量：高达数百GB（如采用HBM2E技术的型......
英伟达赢麻了！马斯克xAI超级算力工厂曝光，10万块H100、数十亿美元
ChatGPT狂飙160天，世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com新建了收费的人工智能中文站https://ai.hzytsoft.cn/更多资源欢迎关注英伟达：尽管建，用的还是我的芯片，最近几年，随着大语言模型的飞速发展与迭代，科技巨头们都竞相投入......
英伟达驱动重装教程
离线安装NVIDIA驱动程序通常涉及下载驱动程序安装包并手动执行安装步骤。以下是详细步骤：1.下载NVIDIA驱动程序首先，你需要在有网络连接的计算机上下载适合你系统的NVIDIA驱动程序安装包。可以从NVIDIA官方驱动下载页面下载。选择你的GPU型号和操作系统，然后下载相应的驱动......
【异常错误】RTX 4090 nvcc fatal : Unsupported gpu architecture ‘compute_89‘
https://mapengsen.blog.csdn.net/article/details/137865369?spm=1001.2101.3001.6650.3&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EYuanLiJiHua%7EPosition-3-137865369-blog-123348901.235%5Ev43%5Epc_blog_bottom_relevance_base8&depth_1......
马斯克的 xAI 融资 60 亿美元；英伟达收购两家 AI 创企丨 RTE 开发者日报 Vol.193
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（RealTimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑......
FasterViT：英伟达提出分层注意力，构造高吞吐CNN-ViT混合网络 | ICLR 2024
论文设计了新的CNN-ViT混合神经网络FasterViT，重点关注计算机视觉应用的图像吞吐能力。FasterViT结合CNN的局部特征学习的特性和ViT的全局建模特性，引入分层注意力（HAT）方法在降低计算成本的同时增加窗口间的交互。在包括分类、对象检测和分割各种CV任务上，FasterViT在精度与图像吞吐......
ubuntu Linux kernel升级导致英伟达显卡驱动失效
Linuxkernel升级导致英伟达显卡驱动失效报错nvidia-smiNVIDIA-SMIhasfailedbecauseitcouldnotcommunicatewiththeNVIDIAdriver.MakesurethatthelatestNVIDIAdriverisinstalledandrunning.#或者nvidia-smiNvidiaNVMLDriver/libraryversionmisma......