详细介绍 NVIDIA GeForce RTX 系列，各显卡配置参数（长期更新 - 2024.12）

标签：2024.12 显存 pin8 KB128 GB GeForce NVIDIA RTX 数量

NVIDIA GeForce RTX 系列是 NVIDIA 面向消费级市场的高性能 GPU 产品线，注重提供高性能的图形处理能力和游戏特性。主要面向游戏玩家和普通用户，同时也被广泛用于深度学习推理和训练等计算密集型任务。

主要 GPU 产品有：50 Series 、40 Series 、30 Series、20 Series、10 Series 。其主要参数如下：

NVIDIA GeForce RTX 50 Series 规格

架构：Blackwell
发布时间：2025.01
制造工艺：TSMC 3 nm

50 系列显卡暂未发布（2024.12），以下数据汇总于社区提供

关键参数	RTX 5090	RTX 5080	RTX 5070 Ti	RTX 5070	RTX 5060	RTX 5050
每秒 FP32 运算次数 (TFLOPS)	109.7	54.19 TFLOPS	45.16 TFLOPS	32.26 TFLOPS	23.22 TFLOPS	12.90 TFLOPS
SM 数量	170	84	70	50	36	20
CUDA Core 数量	21760	10752	8960	6400	4608	2560
Tensor Cores 数量	680	334	280	200	144	80
标准显存配置	32 GB GDDR7	16 GB GDDR7	16 GB GDDR7	12 GB GDDR7	8 GB GDDR7	8 GB GDDR6
显存位宽	512 bit	256 bit	256 bit	192 bit	128 bit	128 bit
显存带宽 (TB/sec)	1.52 TB/sec	710.1 GB/sec	710.1 GB/sec	532.6 GB/sec	355.0 GB/sec	224 GB/sec
一级缓存	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB
二级缓存	88 MB	64 MB	64 MB	40 MB	32 MB	32 MB
显卡总功耗 (W)	500	350	300	220	170	100

NVIDIA GeForce RTX 40 Series 规格

架构：Ada Lovelace
发布时间：2022.09.20
制造工艺：TSMC 4 nm

关键参数	RTX 4090	RTX 4090 D	RTX 4080 SUPER	RTX 4080	RTX 4070 Ti SUPER	RTX 4070 Ti	RTX 4070 SUPER	RTX 4070	RTX 4060 Ti	RTX 4060
发售价格 (美金)	$1,599	$1,599	$1,199.00	$999.00	$799.00	$799.00	$599.00	$599.00	$399	$299.00
晶体管数量	763 亿	763 亿	459 亿	459 亿	459 亿	358 亿	358 亿	358 亿	229 亿	189 亿
晶粒面积 (mm²)	608.4	608.4	378.6	378.6	378.6	294.5	294.5	294.5	190	146
每秒 FP32 运算次数 TFLOPS	82.58	73.54	52.22	48.74	44.1	40.1	35.48	29.15	22.06	15.11
SM 数量	128	114	80	76	66	60	56	46	34	24
CUDA Core 数量	16384	14592	10240	9728	8448	7680	7168	5888	4352	3072
Tensor Cores 数量	512	456	320	304	264	240	224	184	136	96
Ray Tracing Cores 数量	128	114	80	76	66	60	56	46	34	24
纹理映射单元 (TMU) 数量	512	456	320	304	264	240	224	184	136	96
渲染输出单元 (ROP) 数量	176	176	112	112	96	80	80	64	48	32
加速频率	2.52 GHz	2.52 GHz	2.55 GHz	2.51 GHz	2.61 GHz	2.61 GHz	2.48 GHz	2.48 GHz	2.54 GHz	2.46 GHz
基础频率	2.23 GHz	2.28 GHz	2.29 GHz	2.21 GHz	2.34 GHz	2.31 GHz	1.98 GHz	1.92 GHz	2.31 GHz	1.83 GHz
标准显存配置	24 GB GDDR6X	24 GB GDDR6X	16 GB GDDR6X	16 GB GDDR6X	16 GB GDDR6X	12 GB GDDR6X	12 GB GDDR6X	12 GB GDDR6 / 12 GB GDDR6X	16 GB GDDR6 或 8 GB GDDR6	8 GB GDDR6
显存位宽	384 bit	384 bit	256 bit	256 bit	256 bit	192 bit	192 bit	192 bit	128 bit	128 bit
显存带宽 (GB/sec)	1008 GB/sec	1008 GB/sec	736 GB/sec	717 GB/sec	672 GB/sec	504 GB/sec	504 GB/sec	504 GB/sec	288 GB/sec	272 GB/sec
一级缓存	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB
二级缓存	72 MB	72 MB	64 MB	64 MB	48 MB	48 MB	48 MB	36 MB	32 MB	24 MB
最高 GPU 温度	90 ℃	90 ℃	90 ℃	90 ℃	90 ℃	90 ℃	90 ℃	90 ℃	90 ℃	90 ℃
闲置功耗 (W)	19	19	15	13	12	12	11	10	7	7
视频播放功耗 (W)	25	26	22	21	17	20	16	16	13	11
常规游戏功耗 (W)	315	302	246	251	226	226	200	186	140	110
显卡总功耗 (W)	450	425	320	320	285	285	220	200	165 或 160	115
要求的系统功率 (W)	850	850	750	750	700	700	650	650	550	550
所需电源接口	3x8-pin	3x8-pin	3x8-pin	2x8-pin	2x8-pin	2x8-pin	2x8-pin	8-pin	8-pin	8-pin

CUDA Core 是 NVIDIA 显卡架构的核心组成部分，专为处理图形渲染和并行计算任务设计。主要用于传统的浮点运算和整数运算，比如顶点着色、像素渲染，以及科学计算中的矩阵操作、图像处理等。

Tensor Core 是从 Volta 架构（V100）开始引入的，用于矩阵乘法和累加运算，这是深度学习的核心计算任务。主要用于 AI 加速，例如深度学习推理和训练，以及支持图形中的 DLSS（深度学习超级采样）技术。

二者详细区别，可参考另一篇文章： NVIDIA 显卡 CUDA Core 和 Tensor Core 特性及其区别

一级缓存 L1 Cache 位于 GPU 核心内部，与流处理器（Streaming Multiprocessor，SM）等部件紧密相连，访问速度非常快，但容量相对较小。主要用于存储频繁访问的数据，如最近使用的像素数据、顶点数据等，以减少对外部显存的访问次数，提高数据访问的速度

二级缓存 L2 Cache 通常是多个流处理器或计算单元共享的，容量相对较大，但访问速度比 L1 Cache 慢一些。主要用于缓存从显存中读取的数据以及中间计算结果，以便在后续的计算中能够快速地获取这些数据，进一步提高数据的命中率和 GPU 的整体性能

NVIDIA GeForce RTX 30 Series 规格

架构：Ampere
发布时间：2020.09.01
制造工艺：Samsung 8 nm

关键参数	RTX 3090 Ti	RTX 3090	RTX 3080 Ti	RTX 3080	RTX 3070 Ti	RTX 3070	RTX 3060 Ti	RTX 3060	RTX 3050 (8 GB)	RTX 3050 (6 GB)
发售价格 (美金)	$1,999.00	$1,499.00	$1,199.00	$699.00	$599.00	$499.00	$399.00	$329.00	$249.00	$249.00
晶体管数量	283 亿	283 亿	283 亿	283 亿	174 亿	174 亿	174 亿	133 亿	133 亿	133 亿
晶粒面积 (mm²)	628.4	628.4	628.4	628.4	392.5	392.5	392.5	276	276	276
每秒 FP32 运算次数 TFLOPS	33.54	29.28	28.57	25.07	19.35	17.66	13.72	9.46	7.95	7.95
SM 数量	84	82	80	68	48	46	38	28	20	20
CUDA Core 数量	10752	10496	10240	8960 / 8704	6144	5888	4864	3584	2560 (1)	2304
Tensor Cores 数量	336	328	320	272	192	184	152	112	80	80
Ray Tracing Cores 数量	84	82	80	68	48	46	38	28	28	28
纹理映射单元数量	336	328	320	272	192	184	152	112	80	80
渲染输出单元数量	112	112	112	96	96	96	80	48	32	32
加速频率 (GHz)	1.86	1.7	1.67	1.71	1.77	1.73	1.67	1.78	1.78 (1)	1.47
基础频率 (GHz)	1.56	1.4	1.37	1.26 / 1.44	1.58	1.5	1.41	1.32	1.55 (1)	1.04
标准显存配置	24 GB GDDR6X	24 GB GDDR6X	12 GB GDDR6X	12 GB GDDR6X / 10 GB GDDR6X	8 GB GDDR6X	8 GB GDDR6	8 GB GDDR6 / 8 GB GDDR6X	12 GB GDDR6 / 8 GB GDDR6	8 GB GDDR6	6 GB GDDR6
显存位宽	384 bit	384 bit	384 bit	384 bit / 320 bit	256 bit	256 bit	256 bit	192 bit / 128 bit	128 bit	96 bit
显存带宽 (GB/sec)	1008	936	912	760	608	448	448	360	224	224
一级缓存	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB	128 KB
二级缓存	6 MB	6 MB	6 MB	5 MB	4 MB	4 MB	4 MB	3 MB	2 MB	2 MB
最高 GPU 温度 (℃)	92 ℃	93 ℃	93 ℃	93 ℃	93 ℃	93 ℃	93 ℃	93 ℃	93 ℃	93 ℃
显卡总功耗 (W)	450	350	350	350 / 320	290	220	200	170	130	70
要求的系统功率 (W) (8)	850	750	750	750	750	650	600	550	550	300
所需电源接口	3x8-pin	2x8-pin	2x8-pin	2x8-pin	2x8-pin	8-pin	8-pin	8-pin	8-pin	8-pin

NVIDIA GeForce RTX 20 Series 规格

架构：Turing
发布时间：2018.09.20
制造工艺：TSMC 12 nm

关键参数	RTX 2080 Ti	RTX 2080 SUPER	RTX 2080	RTX 2070 SUPER	RTX 2070	RTX 2060 SUPER	RTX 2060
发售价格 (美金)	$999.00	$699.00	$699.00	$499.00	$499.00	$399.00	$349.00
晶体管数量 (亿)	186 亿	136 亿	136 亿	136 亿	108 亿	108 亿	108 亿
晶粒面积 (mm2)	754	545	545	545	445	445	445
每秒 FP32 运算次数 (TFLOPS)	11.8	10.1	8.92	8.22	6.5	6.12	5.24
SM 数量	68	48	46	40	36	34	30
CUDA Core 数量	4352	3072	2944	2560	2304	2176	2176 / 1920
Tensor Cores 数量	544	384	368	320	288	272	240
Ray Tracing Cores 数量	68	48	46	40	36	34	30
纹理映射单元数量	272	192	184	160	144	136	120
渲染输出单元数量	88	64	64	64	64	64	48
加速频率 (GHz)	1.64	1.82	1.8	1.77	1.71	1.65	1.65 / 1.68
基础频率 (GHz)	1.35	1.65	1.52	1.61	1.41	1.47	1.47 / 1.37
标准显存配置	11 GB GDDR6	8 GB GDDR6	8 GB GDDR6	8 GB GDDR6	8 GB GDDR6	8 GB GDDR6	12 GB GDDR6 / 6 GB GDDR6
显存位宽	352 bit	256 bit	256 bit	256 bit	256 bit	256 bit	192 bit
显存带宽 (GB/sec)	616	496	448	448	448	448	336
一级缓存	64 KB	64 KB	64 KB	64 KB	64 KB	64 KB	64 KB
二级缓存	5.5 MB	4 MB	4 MB	4 MB	4 MB	4 MB	3 MB
最高 GPU 温度 (℃)	89	89	88	88	89	89	88
显卡总功耗 (W)	260	250	225	215	185	175	185 / 160
要求的系统功率 (W) (8)	650	650	650	650	550	550	550 / 500
所需电源接口	2x8-pin	6-pin+8-pin	6-pin+8-pin	6-pin+8-pin	8-pin	8-pin	8-pin

NVIDIA GeForce RTX 16 Series 规格

架构：Turing
发布时间：2019.02.22
制造工艺：TSMC 12 nm

关键参数	GTX 1660 Ti	GTX 1660 Super	GTX 1660	GTX 1650 Super	GTX 1650 (G5)	GTX 1650 (G6)	GTX 1630
发售价格 (美金)	¥279.00	¥229.00	¥219.00	¥159.00	¥149.00	¥149.00	None
晶体管数量 (亿)	66	66	66	66	47	47	47
晶粒面积 (mm2)	284	284	284	284	200	200	200
每秒 FP32 运算次数 (TFLOPS)	4.61	4.31	4.31	3.92	2.66	2.53	1.83
SM 数量	24	22	22	20	14	14	8
CUDA Core 数量	1536	1408	1408	1280	896	896	512
纹理映射单元数量	96	88	88	80	56	56	32
渲染输出单元数量	48	48	48	32	32	32	16
加速频率 (MHz)	1770	1785	1785	1725	1665	1590	1785
基础频率 (MHz)	1500	1530	1530	1530	1485	1410	1740
标准显存配置	6GB GDDR6	6GB GDDR6	6GB GDDR5	4GB GDDR6	4GB GDDR5	4GB GDDR6	4GB GDDR6
显存位宽	192 bit	192 bit	192 bit	128 bit	128 bit	128 bit	64 bit
显存带宽 (GB/sec)	288	336	192	192	192	192	128
一级缓存 (KB) (per SM)	64 KB	64 KB	64 KB	64 KB	64 KB	64 KB	64 KB
二级缓存 (MB)	1.5 MB	1.5 MB	1.5 MB	1 MB	1 MB	1 MB	1 MB
最高 GPU 温度 (℃)	95	93	95	90	92	94	94
显卡总功耗 (W)	120	125	120	100	75	75	75
要求的系统功率 (W) (8)	450	450	450	350	300	300	300
所需电源接口	8-pin	8-pin	8-pin	6-pin	6-pin	6-pin	6-pin

NVIDIA GeForce RTX 10 Series 规格

架构：Pascal
发布时间：2016
制造工艺：Samsung 16 nm

关键参数	GTX 1080 Ti	GTX 1080	GTX 1070 Ti	GTX 1070	GTX 1060	GTX 1050 Ti	GTX 1050
发售价格 (美金)	$120.00	$72.00	$72.00	$72.00	$72.00	$33.00	$33.00
晶体管数量 (亿)	471	314	312	314	314	132	132
晶粒面积 (mm2)	699	599	449	379	249	139	109
每秒 FP32 运算次数 (TFLOPS)	10.61	8.23	7.82	5.78	3.86	1.98	1.73
SM 数量	28	20	19	15	10	6	5
CUDA Core 数量	35384	2560	2432	1920	1280	768	640
纹理映射单元数量	224	160	152	120	80	48	40
渲染输出单元数量	88	64	64	64	48	32	32
加速频率 (MHz)	1582	1733	1683	1683	1708	1392	1455
基础频率 (MHz)	None	1607	1607	1506	1506	1290	1354
标准显存配置	11 GB GDDR5X	8 GB GDDR5X	8 GB GDDR5	8 GB GDDR5	6 GB GDDR5X	4 GB GDDR5	2 GB GDDR5
显存位宽	352	256	256	256	192	128	128
显存带宽 (GB/sec)	484	320	256	256	192	112	112
一级缓存 (KB) (per SM)	48 KB	48 KB	48 KB	48 KB	48 KB	48 KB	48 KB
二级缓存 (MB)	2.78	2	2	2	1.5	1	1
最高 GPU 温度 (℃)	91	94	94	94	94	97	97
显卡总功耗 (W)	250	180	180	150	120	75	75
要求的系统功率 (W) (8)	600	500	500	500	400	300	300
所需电源接口	6-pin + 8-pin	8-Pin	8-Pin	8-Pin	6-Pin	None	None

NVIDIA GeForce RTX 9 Series 规格

关键参数	GTX 980 Ti	GTX 980	GTX 970	GTX 960	GTX 950
发售价格 (美金)	$80.00	$52.00	$52.00	$29.40	$29.40
晶体管数量 (亿)	601	398	398	227	227
晶粒面积 (mm2)	649	549	329	199	159
每秒 FP32 运算次数 (TFLOPS)	5.63	4.61	3.49	2.31	1.57
SMM 数量	22	16	13	8	6
CUDA Core 数量	2816	2048	1664	1024	768
纹理映射单元数量	176	128	104	64	48
渲染输出单元数量	96	64	56	32	32
加速频率 (MHz)	1076	1216	1178	1178	1188
基础频率 (MHz)	1000	1126	1050	1127	1024
标准显存配置	6 GB GDDR5	4 GB GDDR5	4 GB GDDR5	2 GB GDDR5	2 GB GDDR5
显存位宽	384	256	224	128	128
显存带宽 (GB/sec)	336	224	196	112	106
一级缓存 (KB) (per SMM)	48 KB	48 KB	48 KB	48 KB	48 KB
二级缓存 (MB)	3	2	1.75	1	1
最高 GPU 温度 (℃)	92	98	98	98	95
显卡总功耗 (W)	250	165	145	120	90
要求的系统功率 (W) (8)	600	500	500	400	350
所需电源接口	6-pin + 8-pin	2x6-Pin	2x6-Pin	6-Pin	6-Pin

码字不易，若觉得本文对你有用，欢迎点赞

标签：2024.12,显存,pin8,KB128,GB,GeForce,NVIDIA,RTX,数量
From： https://blog.csdn.net/gumc123/article/details/144304337