NVIDIA GeForce RTX 系列是 NVIDIA 面向消费级市场的高性能 GPU 产品线,注重提供高性能的图形处理能力和游戏特性。主要面向游戏玩家和普通用户,同时也被广泛用于深度学习推理和训练等计算密集型任务。
主要 GPU 产品有:50 Series 、40 Series 、30 Series、20 Series、10 Series 。其主要参数如下:
NVIDIA GeForce RTX 50 Series 规格
架构:Blackwell
发布时间:2025.01
制造工艺:TSMC 3 nm
50 系列显卡暂未发布(2024.12),以下数据汇总于社区提供
关键参数 | RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 | RTX 5060 | RTX 5050 |
---|---|---|---|---|---|---|
每秒 FP32 运算次数 (TFLOPS) | 109.7 | 54.19 TFLOPS | 45.16 TFLOPS | 32.26 TFLOPS | 23.22 TFLOPS | 12.90 TFLOPS |
SM 数量 | 170 | 84 | 70 | 50 | 36 | 20 |
CUDA Core 数量 | 21760 | 10752 | 8960 | 6400 | 4608 | 2560 |
Tensor Cores 数量 | 680 | 334 | 280 | 200 | 144 | 80 |
标准显存配置 | 32 GB GDDR7 | 16 GB GDDR7 | 16 GB GDDR7 | 12 GB GDDR7 | 8 GB GDDR7 | 8 GB GDDR6 |
显存位宽 | 512 bit | 256 bit | 256 bit | 192 bit | 128 bit | 128 bit |
显存带宽 (TB/sec) | 1.52 TB/sec | 710.1 GB/sec | 710.1 GB/sec | 532.6 GB/sec | 355.0 GB/sec | 224 GB/sec |
一级缓存 | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB |
二级缓存 | 88 MB | 64 MB | 64 MB | 40 MB | 32 MB | 32 MB |
显卡总功耗 (W) | 500 | 350 | 300 | 220 | 170 | 100 |
NVIDIA GeForce RTX 40 Series 规格
架构:Ada Lovelace
发布时间:2022.09.20
制造工艺:TSMC 4 nm
关键参数 | RTX 4090 | RTX 4090 D | RTX 4080 SUPER | RTX 4080 | RTX 4070 Ti SUPER | RTX 4070 Ti | RTX 4070 SUPER | RTX 4070 | RTX 4060 Ti | RTX 4060 |
---|---|---|---|---|---|---|---|---|---|---|
发售价格 (美金) | $1,599 | $1,599 | $1,199.00 | $999.00 | $799.00 | $799.00 | $599.00 | $599.00 | $399 | $299.00 |
晶体管数量 | 763 亿 | 763 亿 | 459 亿 | 459 亿 | 459 亿 | 358 亿 | 358 亿 | 358 亿 | 229 亿 | 189 亿 |
晶粒面积 (mm2) | 608.4 | 608.4 | 378.6 | 378.6 | 378.6 | 294.5 | 294.5 | 294.5 | 190 | 146 |
每秒 FP32 运算次数 TFLOPS | 82.58 | 73.54 | 52.22 | 48.74 | 44.1 | 40.1 | 35.48 | 29.15 | 22.06 | 15.11 |
SM 数量 | 128 | 114 | 80 | 76 | 66 | 60 | 56 | 46 | 34 | 24 |
CUDA Core 数量 | 16384 | 14592 | 10240 | 9728 | 8448 | 7680 | 7168 | 5888 | 4352 | 3072 |
Tensor Cores 数量 | 512 | 456 | 320 | 304 | 264 | 240 | 224 | 184 | 136 | 96 |
Ray Tracing Cores 数量 | 128 | 114 | 80 | 76 | 66 | 60 | 56 | 46 | 34 | 24 |
纹理映射单元 (TMU) 数量 | 512 | 456 | 320 | 304 | 264 | 240 | 224 | 184 | 136 | 96 |
渲染输出单元 (ROP) 数量 | 176 | 176 | 112 | 112 | 96 | 80 | 80 | 64 | 48 | 32 |
加速频率 | 2.52 GHz | 2.52 GHz | 2.55 GHz | 2.51 GHz | 2.61 GHz | 2.61 GHz | 2.48 GHz | 2.48 GHz | 2.54 GHz | 2.46 GHz |
基础频率 | 2.23 GHz | 2.28 GHz | 2.29 GHz | 2.21 GHz | 2.34 GHz | 2.31 GHz | 1.98 GHz | 1.92 GHz | 2.31 GHz | 1.83 GHz |
标准显存配置 | 24 GB GDDR6X | 24 GB GDDR6X | 16 GB GDDR6X | 16 GB GDDR6X | 16 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6 / 12 GB GDDR6X | 16 GB GDDR6 或 8 GB GDDR6 | 8 GB GDDR6 |
显存位宽 | 384 bit | 384 bit | 256 bit | 256 bit | 256 bit | 192 bit | 192 bit | 192 bit | 128 bit | 128 bit |
显存带宽 (GB/sec) | 1008 GB/sec | 1008 GB/sec | 736 GB/sec | 717 GB/sec | 672 GB/sec | 504 GB/sec | 504 GB/sec | 504 GB/sec | 288 GB/sec | 272 GB/sec |
一级缓存 | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB |
二级缓存 | 72 MB | 72 MB | 64 MB | 64 MB | 48 MB | 48 MB | 48 MB | 36 MB | 32 MB | 24 MB |
最高 GPU 温度 | 90 ℃ | 90 ℃ | 90 ℃ | 90 ℃ | 90 ℃ | 90 ℃ | 90 ℃ | 90 ℃ | 90 ℃ | 90 ℃ |
闲置功耗 (W) | 19 | 19 | 15 | 13 | 12 | 12 | 11 | 10 | 7 | 7 |
视频播放功耗 (W) | 25 | 26 | 22 | 21 | 17 | 20 | 16 | 16 | 13 | 11 |
常规游戏功耗 (W) | 315 | 302 | 246 | 251 | 226 | 226 | 200 | 186 | 140 | 110 |
显卡总功耗 (W) | 450 | 425 | 320 | 320 | 285 | 285 | 220 | 200 | 165 或 160 | 115 |
要求的系统功率 (W) | 850 | 850 | 750 | 750 | 700 | 700 | 650 | 650 | 550 | 550 |
所需电源接口 | 3x8-pin | 3x8-pin | 3x8-pin | 2x8-pin | 2x8-pin | 2x8-pin | 2x8-pin | 8-pin | 8-pin | 8-pin |
CUDA Core 是 NVIDIA 显卡架构的核心组成部分,专为处理图形渲染和并行计算任务设计。主要用于传统的 浮点运算 和 整数运算,比如顶点着色、像素渲染,以及科学计算中的矩阵操作、图像处理等。
Tensor Core 是从 Volta 架构(V100) 开始引入的,用于 矩阵乘法和累加运算,这是深度学习的核心计算任务。主要用于 AI 加速,例如 深度学习推理 和 训练,以及支持图形中的 DLSS(深度学习超级采样) 技术。
二者详细区别,可参考另一篇文章: NVIDIA 显卡 CUDA Core 和 Tensor Core 特性及其区别
一级缓存 L1 Cache 位于 GPU 核心内部,与流处理器(Streaming Multiprocessor,SM)等部件紧密相连,访问速度非常快,但容量相对较小。主要用于存储频繁访问的数据,如最近使用的像素数据、顶点数据等,以减少对外部显存的访问次数,提高数据访问的速度
二级缓存 L2 Cache 通常是多个流处理器或计算单元共享的,容量相对较大,但访问速度比 L1 Cache 慢一些。主要用于缓存从显存中读取的数据以及中间计算结果,以便在后续的计算中能够快速地获取这些数据,进一步提高数据的命中率和 GPU 的整体性能
NVIDIA GeForce RTX 30 Series 规格
架构:Ampere
发布时间:2020.09.01
制造工艺:Samsung 8 nm
关键参数 | RTX 3090 Ti | RTX 3090 | RTX 3080 Ti | RTX 3080 | RTX 3070 Ti | RTX 3070 | RTX 3060 Ti | RTX 3060 | RTX 3050 (8 GB) | RTX 3050 (6 GB) |
---|---|---|---|---|---|---|---|---|---|---|
发售价格 (美金) | $1,999.00 | $1,499.00 | $1,199.00 | $699.00 | $599.00 | $499.00 | $399.00 | $329.00 | $249.00 | $249.00 |
晶体管数量 | 283 亿 | 283 亿 | 283 亿 | 283 亿 | 174 亿 | 174 亿 | 174 亿 | 133 亿 | 133 亿 | 133 亿 |
晶粒面积 (mm2) | 628.4 | 628.4 | 628.4 | 628.4 | 392.5 | 392.5 | 392.5 | 276 | 276 | 276 |
每秒 FP32 运算次数 TFLOPS | 33.54 | 29.28 | 28.57 | 25.07 | 19.35 | 17.66 | 13.72 | 9.46 | 7.95 | 7.95 |
SM 数量 | 84 | 82 | 80 | 68 | 48 | 46 | 38 | 28 | 20 | 20 |
CUDA Core 数量 | 10752 | 10496 | 10240 | 8960 / 8704 | 6144 | 5888 | 4864 | 3584 | 2560 (1) | 2304 |
Tensor Cores 数量 | 336 | 328 | 320 | 272 | 192 | 184 | 152 | 112 | 80 | 80 |
Ray Tracing Cores 数量 | 84 | 82 | 80 | 68 | 48 | 46 | 38 | 28 | 28 | 28 |
纹理映射单元 数量 | 336 | 328 | 320 | 272 | 192 | 184 | 152 | 112 | 80 | 80 |
渲染输出单元 数量 | 112 | 112 | 112 | 96 | 96 | 96 | 80 | 48 | 32 | 32 |
加速频率 (GHz) | 1.86 | 1.7 | 1.67 | 1.71 | 1.77 | 1.73 | 1.67 | 1.78 | 1.78 (1) | 1.47 |
基础频率 (GHz) | 1.56 | 1.4 | 1.37 | 1.26 / 1.44 | 1.58 | 1.5 | 1.41 | 1.32 | 1.55 (1) | 1.04 |
标准显存配置 | 24 GB GDDR6X | 24 GB GDDR6X | 12 GB GDDR6X | 12 GB GDDR6X / 10 GB GDDR6X | 8 GB GDDR6X | 8 GB GDDR6 | 8 GB GDDR6 / 8 GB GDDR6X | 12 GB GDDR6 / 8 GB GDDR6 | 8 GB GDDR6 | 6 GB GDDR6 |
显存位宽 | 384 bit | 384 bit | 384 bit | 384 bit / 320 bit | 256 bit | 256 bit | 256 bit | 192 bit / 128 bit | 128 bit | 96 bit |
显存带宽 (GB/sec) | 1008 | 936 | 912 | 760 | 608 | 448 | 448 | 360 | 224 | 224 |
一级缓存 | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB | 128 KB |
二级缓存 | 6 MB | 6 MB | 6 MB | 5 MB | 4 MB | 4 MB | 4 MB | 3 MB | 2 MB | 2 MB |
最高 GPU 温度 (℃) | 92 ℃ | 93 ℃ | 93 ℃ | 93 ℃ | 93 ℃ | 93 ℃ | 93 ℃ | 93 ℃ | 93 ℃ | 93 ℃ |
显卡总功耗 (W) | 450 | 350 | 350 | 350 / 320 | 290 | 220 | 200 | 170 | 130 | 70 |
要求的系统功率 (W) (8) | 850 | 750 | 750 | 750 | 750 | 650 | 600 | 550 | 550 | 300 |
所需电源接口 | 3x8-pin | 2x8-pin | 2x8-pin | 2x8-pin | 2x8-pin | 8-pin | 8-pin | 8-pin | 8-pin | 8-pin |
NVIDIA GeForce RTX 20 Series 规格
架构:Turing
发布时间:2018.09.20
制造工艺:TSMC 12 nm
关键参数 | RTX 2080 Ti | RTX 2080 SUPER | RTX 2080 | RTX 2070 SUPER | RTX 2070 | RTX 2060 SUPER | RTX 2060 |
---|---|---|---|---|---|---|---|
发售价格 (美金) | $999.00 | $699.00 | $699.00 | $499.00 | $499.00 | $399.00 | $349.00 |
晶体管数量 (亿) | 186 亿 | 136 亿 | 136 亿 | 136 亿 | 108 亿 | 108 亿 | 108 亿 |
晶粒面积 (mm2) | 754 | 545 | 545 | 545 | 445 | 445 | 445 |
每秒 FP32 运算次数 (TFLOPS) | 11.8 | 10.1 | 8.92 | 8.22 | 6.5 | 6.12 | 5.24 |
SM 数量 | 68 | 48 | 46 | 40 | 36 | 34 | 30 |
CUDA Core 数量 | 4352 | 3072 | 2944 | 2560 | 2304 | 2176 | 2176 / 1920 |
Tensor Cores 数量 | 544 | 384 | 368 | 320 | 288 | 272 | 240 |
Ray Tracing Cores 数量 | 68 | 48 | 46 | 40 | 36 | 34 | 30 |
纹理映射单元数量 | 272 | 192 | 184 | 160 | 144 | 136 | 120 |
渲染输出单元数量 | 88 | 64 | 64 | 64 | 64 | 64 | 48 |
加速频率 (GHz) | 1.64 | 1.82 | 1.8 | 1.77 | 1.71 | 1.65 | 1.65 / 1.68 |
基础频率 (GHz) | 1.35 | 1.65 | 1.52 | 1.61 | 1.41 | 1.47 | 1.47 / 1.37 |
标准显存配置 | 11 GB GDDR6 | 8 GB GDDR6 | 8 GB GDDR6 | 8 GB GDDR6 | 8 GB GDDR6 | 8 GB GDDR6 | 12 GB GDDR6 / 6 GB GDDR6 |
显存位宽 | 352 bit | 256 bit | 256 bit | 256 bit | 256 bit | 256 bit | 192 bit |
显存带宽 (GB/sec) | 616 | 496 | 448 | 448 | 448 | 448 | 336 |
一级缓存 | 64 KB | 64 KB | 64 KB | 64 KB | 64 KB | 64 KB | 64 KB |
二级缓存 | 5.5 MB | 4 MB | 4 MB | 4 MB | 4 MB | 4 MB | 3 MB |
最高 GPU 温度 (℃) | 89 | 89 | 88 | 88 | 89 | 89 | 88 |
显卡总功耗 (W) | 260 | 250 | 225 | 215 | 185 | 175 | 185 / 160 |
要求的系统功率 (W) (8) | 650 | 650 | 650 | 650 | 550 | 550 | 550 / 500 |
所需电源接口 | 2x8-pin | 6-pin+8-pin | 6-pin+8-pin | 6-pin+8-pin | 8-pin | 8-pin | 8-pin |
NVIDIA GeForce RTX 16 Series 规格
架构:Turing
发布时间:2019.02.22
制造工艺:TSMC 12 nm
关键参数 | GTX 1660 Ti | GTX 1660 Super | GTX 1660 | GTX 1650 Super | GTX 1650 (G5) | GTX 1650 (G6) | GTX 1630 |
---|---|---|---|---|---|---|---|
发售价格 (美金) | ¥279.00 | ¥229.00 | ¥219.00 | ¥159.00 | ¥149.00 | ¥149.00 | None |
晶体管数量 (亿) | 66 | 66 | 66 | 66 | 47 | 47 | 47 |
晶粒面积 (mm2) | 284 | 284 | 284 | 284 | 200 | 200 | 200 |
每秒 FP32 运算次数 (TFLOPS) | 4.61 | 4.31 | 4.31 | 3.92 | 2.66 | 2.53 | 1.83 |
SM 数量 | 24 | 22 | 22 | 20 | 14 | 14 | 8 |
CUDA Core 数量 | 1536 | 1408 | 1408 | 1280 | 896 | 896 | 512 |
纹理映射单元数量 | 96 | 88 | 88 | 80 | 56 | 56 | 32 |
渲染输出单元数量 | 48 | 48 | 48 | 32 | 32 | 32 | 16 |
加速频率 (MHz) | 1770 | 1785 | 1785 | 1725 | 1665 | 1590 | 1785 |
基础频率 (MHz) | 1500 | 1530 | 1530 | 1530 | 1485 | 1410 | 1740 |
标准显存配置 | 6GB GDDR6 | 6GB GDDR6 | 6GB GDDR5 | 4GB GDDR6 | 4GB GDDR5 | 4GB GDDR6 | 4GB GDDR6 |
显存位宽 | 192 bit | 192 bit | 192 bit | 128 bit | 128 bit | 128 bit | 64 bit |
显存带宽 (GB/sec) | 288 | 336 | 192 | 192 | 192 | 192 | 128 |
一级缓存 (KB) (per SM) | 64 KB | 64 KB | 64 KB | 64 KB | 64 KB | 64 KB | 64 KB |
二级缓存 (MB) | 1.5 MB | 1.5 MB | 1.5 MB | 1 MB | 1 MB | 1 MB | 1 MB |
最高 GPU 温度 (℃) | 95 | 93 | 95 | 90 | 92 | 94 | 94 |
显卡总功耗 (W) | 120 | 125 | 120 | 100 | 75 | 75 | 75 |
要求的系统功率 (W) (8) | 450 | 450 | 450 | 350 | 300 | 300 | 300 |
所需电源接口 | 8-pin | 8-pin | 8-pin | 6-pin | 6-pin | 6-pin | 6-pin |
NVIDIA GeForce RTX 10 Series 规格
架构:Pascal
发布时间:2016
制造工艺:Samsung 16 nm
关键参数 | GTX 1080 Ti | GTX 1080 | GTX 1070 Ti | GTX 1070 | GTX 1060 | GTX 1050 Ti | GTX 1050 |
---|---|---|---|---|---|---|---|
发售价格 (美金) | $120.00 | $72.00 | $72.00 | $72.00 | $72.00 | $33.00 | $33.00 |
晶体管数量 (亿) | 471 | 314 | 312 | 314 | 314 | 132 | 132 |
晶粒面积 (mm2) | 699 | 599 | 449 | 379 | 249 | 139 | 109 |
每秒 FP32 运算次数 (TFLOPS) | 10.61 | 8.23 | 7.82 | 5.78 | 3.86 | 1.98 | 1.73 |
SM 数量 | 28 | 20 | 19 | 15 | 10 | 6 | 5 |
CUDA Core 数量 | 35384 | 2560 | 2432 | 1920 | 1280 | 768 | 640 |
纹理映射单元数量 | 224 | 160 | 152 | 120 | 80 | 48 | 40 |
渲染输出单元数量 | 88 | 64 | 64 | 64 | 48 | 32 | 32 |
加速频率 (MHz) | 1582 | 1733 | 1683 | 1683 | 1708 | 1392 | 1455 |
基础频率 (MHz) | None | 1607 | 1607 | 1506 | 1506 | 1290 | 1354 |
标准显存配置 | 11 GB GDDR5X | 8 GB GDDR5X | 8 GB GDDR5 | 8 GB GDDR5 | 6 GB GDDR5X | 4 GB GDDR5 | 2 GB GDDR5 |
显存位宽 | 352 | 256 | 256 | 256 | 192 | 128 | 128 |
显存带宽 (GB/sec) | 484 | 320 | 256 | 256 | 192 | 112 | 112 |
一级缓存 (KB) (per SM) | 48 KB | 48 KB | 48 KB | 48 KB | 48 KB | 48 KB | 48 KB |
二级缓存 (MB) | 2.78 | 2 | 2 | 2 | 1.5 | 1 | 1 |
最高 GPU 温度 (℃) | 91 | 94 | 94 | 94 | 94 | 97 | 97 |
显卡总功耗 (W) | 250 | 180 | 180 | 150 | 120 | 75 | 75 |
要求的系统功率 (W) (8) | 600 | 500 | 500 | 500 | 400 | 300 | 300 |
所需电源接口 | 6-pin + 8-pin | 8-Pin | 8-Pin | 8-Pin | 6-Pin | None | None |
NVIDIA GeForce RTX 9 Series 规格
关键参数 | GTX 980 Ti | GTX 980 | GTX 970 | GTX 960 | GTX 950 |
---|---|---|---|---|---|
发售价格 (美金) | $80.00 | $52.00 | $52.00 | $29.40 | $29.40 |
晶体管数量 (亿) | 601 | 398 | 398 | 227 | 227 |
晶粒面积 (mm2) | 649 | 549 | 329 | 199 | 159 |
每秒 FP32 运算次数 (TFLOPS) | 5.63 | 4.61 | 3.49 | 2.31 | 1.57 |
SMM 数量 | 22 | 16 | 13 | 8 | 6 |
CUDA Core 数量 | 2816 | 2048 | 1664 | 1024 | 768 |
纹理映射单元数量 | 176 | 128 | 104 | 64 | 48 |
渲染输出单元数量 | 96 | 64 | 56 | 32 | 32 |
加速频率 (MHz) | 1076 | 1216 | 1178 | 1178 | 1188 |
基础频率 (MHz) | 1000 | 1126 | 1050 | 1127 | 1024 |
标准显存配置 | 6 GB GDDR5 | 4 GB GDDR5 | 4 GB GDDR5 | 2 GB GDDR5 | 2 GB GDDR5 |
显存位宽 | 384 | 256 | 224 | 128 | 128 |
显存带宽 (GB/sec) | 336 | 224 | 196 | 112 | 106 |
一级缓存 (KB) (per SMM) | 48 KB | 48 KB | 48 KB | 48 KB | 48 KB |
二级缓存 (MB) | 3 | 2 | 1.75 | 1 | 1 |
最高 GPU 温度 (℃) | 92 | 98 | 98 | 98 | 95 |
显卡总功耗 (W) | 250 | 165 | 145 | 120 | 90 |
要求的系统功率 (W) (8) | 600 | 500 | 500 | 400 | 350 |
所需电源接口 | 6-pin + 8-pin | 2x6-Pin | 2x6-Pin | 6-Pin | 6-Pin |
码字不易,若觉得本文对你有用,欢迎点赞
标签:2024.12,显存,pin8,KB128,GB,GeForce,NVIDIA,RTX,数量 From: https://blog.csdn.net/gumc123/article/details/144304337