首页 > 其他分享 >详细介绍 NVIDIA GeForce RTX 系列,各显卡配置参数(长期更新 - 2024.12)

详细介绍 NVIDIA GeForce RTX 系列,各显卡配置参数(长期更新 - 2024.12)

时间:2024-12-07 14:30:20浏览次数:4  
标签:2024.12 显存 pin8 KB128 GB GeForce NVIDIA RTX 数量

NVIDIA GeForce RTX 系列是 NVIDIA 面向消费级市场的高性能 GPU 产品线,注重提供高性能的图形处理能力和游戏特性。主要面向游戏玩家和普通用户,同时也被广泛用于深度学习推理和训练等计算密集型任务。

主要 GPU 产品有:50 Series 、40 Series 、30 Series、20 Series、10 Series 。其主要参数如下:


NVIDIA GeForce RTX 50 Series 规格


架构:Blackwell
发布时间:2025.01
制造工艺:TSMC 3 nm

50 系列显卡暂未发布(2024.12),以下数据汇总于社区提供


关键参数RTX 5090RTX 5080RTX 5070 TiRTX 5070RTX 5060RTX 5050
每秒 FP32 运算次数 (TFLOPS)109.754.19 TFLOPS45.16 TFLOPS32.26 TFLOPS23.22 TFLOPS12.90 TFLOPS
SM 数量1708470503620
CUDA Core 数量21760107528960640046082560
Tensor Cores 数量68033428020014480
标准显存配置32 GB GDDR716 GB GDDR716 GB GDDR712 GB GDDR78 GB GDDR78 GB GDDR6
显存位宽512 bit256 bit256 bit192 bit128 bit128 bit
显存带宽 (TB/sec)1.52 TB/sec710.1 GB/sec710.1 GB/sec532.6 GB/sec355.0 GB/sec224 GB/sec
一级缓存128 KB128 KB128 KB128 KB128 KB128 KB
二级缓存88 MB64 MB64 MB40 MB32 MB32 MB
显卡总功耗 (W)500350300220170100

NVIDIA GeForce RTX 40 Series 规格


架构:Ada Lovelace
发布时间:2022.09.20
制造工艺:TSMC 4 nm


关键参数RTX 4090RTX 4090 DRTX 4080 SUPERRTX 4080RTX 4070 Ti SUPERRTX 4070 TiRTX 4070 SUPERRTX 4070RTX 4060 TiRTX 4060
发售价格 (美金)$1,599$1,599$1,199.00$999.00$799.00$799.00$599.00$599.00$399$299.00
晶体管数量763 亿763 亿459 亿459 亿459 亿358 亿358 亿358 亿229 亿189 亿
晶粒面积 (mm2)608.4608.4378.6378.6378.6294.5294.5294.5190146
每秒 FP32 运算次数 TFLOPS 82.5873.5452.2248.7444.140.135.4829.1522.0615.11
SM 数量1281148076666056463424
CUDA Core 数量1638414592102409728844876807168588843523072
Tensor Cores 数量51245632030426424022418413696
Ray Tracing Cores 数量1281148076666056463424
纹理映射单元 (TMU) 数量51245632030426424022418413696
渲染输出单元 (ROP) 数量176176112112968080644832
加速频率2.52 GHz2.52 GHz2.55 GHz2.51 GHz2.61 GHz2.61 GHz2.48 GHz2.48 GHz2.54 GHz2.46 GHz
基础频率2.23 GHz2.28 GHz2.29 GHz2.21 GHz2.34 GHz2.31 GHz1.98 GHz1.92 GHz2.31 GHz1.83 GHz
标准显存配置24 GB GDDR6X24 GB GDDR6X16 GB GDDR6X16 GB GDDR6X16 GB GDDR6X12 GB GDDR6X12 GB GDDR6X12 GB GDDR6 / 12 GB GDDR6X16 GB GDDR6 或 8 GB GDDR68 GB GDDR6
显存位宽384 bit384 bit256 bit256 bit256 bit192 bit192 bit192 bit128 bit128 bit
显存带宽 (GB/sec)1008 GB/sec1008 GB/sec736 GB/sec717 GB/sec672 GB/sec504 GB/sec504 GB/sec504 GB/sec288 GB/sec272 GB/sec
一级缓存128 KB128 KB128 KB128 KB128 KB128 KB128 KB128 KB128 KB128 KB
二级缓存72 MB72 MB64 MB64 MB48 MB48 MB48 MB36 MB32 MB24 MB
最高 GPU 温度90 ℃90 ℃90 ℃90 ℃90 ℃90 ℃90 ℃90 ℃90 ℃90 ℃
闲置功耗 (W)191915131212111077
视频播放功耗 (W)25262221172016161311
常规游戏功耗 (W)315302246251226226200186140110
显卡总功耗 (W)450425320320285285220200165 或 160115
要求的系统功率 (W)850850750750700700650650550550
所需电源接口3x8-pin3x8-pin3x8-pin2x8-pin2x8-pin2x8-pin2x8-pin8-pin8-pin8-pin

CUDA Core 是 NVIDIA 显卡架构的核心组成部分,专为处理图形渲染和并行计算任务设计。主要用于传统的 浮点运算 和 整数运算,比如顶点着色、像素渲染,以及科学计算中的矩阵操作、图像处理等。

Tensor Core 是从 Volta 架构(V100) 开始引入的,用于 矩阵乘法和累加运算,这是深度学习的核心计算任务。主要用于 AI 加速,例如 深度学习推理 和 训练,以及支持图形中的 DLSS(深度学习超级采样) 技术。

二者详细区别,可参考另一篇文章 NVIDIA 显卡 CUDA Core 和 Tensor Core 特性及其区别

一级缓存 L1 Cache 位于 GPU 核心内部,与流处理器(Streaming Multiprocessor,SM)等部件紧密相连,访问速度非常快,但容量相对较小。主要用于存储频繁访问的数据,如最近使用的像素数据、顶点数据等,以减少对外部显存的访问次数,提高数据访问的速度

二级缓存 L2 Cache 通常是多个流处理器或计算单元共享的,容量相对较大,但访问速度比 L1 Cache 慢一些。主要用于缓存从显存中读取的数据以及中间计算结果,以便在后续的计算中能够快速地获取这些数据,进一步提高数据的命中率和 GPU 的整体性能


NVIDIA GeForce RTX 30 Series 规格


架构:Ampere
发布时间:2020.09.01
制造工艺:Samsung 8 nm


关键参数RTX 3090 TiRTX 3090RTX 3080 TiRTX 3080RTX 3070 TiRTX 3070RTX 3060 TiRTX 3060RTX 3050 (8 GB)RTX 3050 (6 GB)
发售价格 (美金)$1,999.00$1,499.00$1,199.00$699.00$599.00$499.00$399.00$329.00$249.00$249.00
晶体管数量283 亿283 亿283 亿283 亿174 亿174 亿174 亿133 亿133 亿133 亿
晶粒面积 (mm2)628.4628.4628.4628.4392.5392.5392.5276276276
每秒 FP32 运算次数 TFLOPS33.5429.2828.5725.0719.3517.6613.729.467.957.95
SM 数量84828068484638282020
CUDA Core 数量1075210496102408960 / 870461445888486435842560 (1)2304
Tensor Cores 数量3363283202721921841521128080
Ray Tracing Cores 数量84828068484638282828
纹理映射单元 数量3363283202721921841521128080
渲染输出单元 数量11211211296969680483232
加速频率 (GHz)1.861.71.671.711.771.731.671.781.78 (1)1.47
基础频率 (GHz)1.561.41.371.26 / 1.441.581.51.411.321.55 (1)1.04
标准显存配置24 GB GDDR6X24 GB GDDR6X12 GB GDDR6X12 GB GDDR6X / 10 GB GDDR6X8 GB GDDR6X8 GB GDDR68 GB GDDR6 / 8 GB GDDR6X12 GB GDDR6 / 8 GB GDDR68 GB GDDR66 GB GDDR6
显存位宽384 bit384 bit384 bit384 bit / 320 bit256 bit256 bit256 bit192 bit / 128 bit128 bit96 bit
显存带宽 (GB/sec)1008936912760608448448360224224
一级缓存128 KB128 KB128 KB128 KB128 KB128 KB128 KB128 KB128 KB128 KB
二级缓存6 MB6 MB6 MB5 MB4 MB4 MB4 MB3 MB2 MB2 MB
最高 GPU 温度 (℃)92 ℃93 ℃93 ℃93 ℃93 ℃93 ℃93 ℃93 ℃93 ℃93 ℃
显卡总功耗 (W)450350350350 / 32029022020017013070
要求的系统功率 (W) (8)850750750750750650600550550300
所需电源接口3x8-pin2x8-pin2x8-pin2x8-pin2x8-pin8-pin8-pin8-pin8-pin8-pin

NVIDIA GeForce RTX 20 Series 规格


架构:Turing
发布时间:2018.09.20
制造工艺:TSMC 12 nm


关键参数RTX 2080 TiRTX 2080 SUPERRTX 2080RTX 2070 SUPERRTX 2070RTX 2060 SUPERRTX 2060
发售价格 (美金)$999.00$699.00$699.00$499.00$499.00$399.00$349.00
晶体管数量 (亿)186 亿136 亿136 亿136 亿108 亿108 亿108 亿
晶粒面积 (mm2)754545545545445445445
每秒 FP32 运算次数 (TFLOPS)11.810.18.928.226.56.125.24
SM 数量68484640363430
CUDA Core 数量4352307229442560230421762176 / 1920
Tensor Cores 数量544384368320288272240
Ray Tracing Cores 数量68484640363430
纹理映射单元数量272192184160144136120
渲染输出单元数量88646464646448
加速频率 (GHz)1.641.821.81.771.711.651.65 / 1.68
基础频率 (GHz)1.351.651.521.611.411.471.47 / 1.37
标准显存配置11 GB GDDR68 GB GDDR68 GB GDDR68 GB GDDR68 GB GDDR68 GB GDDR612 GB GDDR6 / 6 GB GDDR6
显存位宽352 bit256 bit256 bit256 bit256 bit256 bit192 bit
显存带宽 (GB/sec)616496448448448448336
一级缓存64 KB64 KB64 KB64 KB64 KB64 KB64 KB
二级缓存5.5 MB4 MB4 MB4 MB4 MB4 MB3 MB
最高 GPU 温度 (℃)89898888898988
显卡总功耗 (W)260250225215185175185 / 160
要求的系统功率 (W) (8)650650650650550550550 / 500
所需电源接口2x8-pin6-pin+8-pin6-pin+8-pin6-pin+8-pin8-pin8-pin8-pin

NVIDIA GeForce RTX 16 Series 规格


架构:Turing
发布时间:2019.02.22
制造工艺:TSMC 12 nm


关键参数GTX 1660 TiGTX 1660 SuperGTX 1660GTX 1650 SuperGTX 1650 (G5)GTX 1650 (G6)GTX 1630
发售价格 (美金)¥279.00¥229.00¥219.00¥159.00¥149.00¥149.00None
晶体管数量 (亿)66666666474747
晶粒面积 (mm2)284284284284200200200
每秒 FP32 运算次数 (TFLOPS)4.614.314.313.922.662.531.83
SM 数量2422222014148
CUDA Core 数量1536140814081280896896512
纹理映射单元数量96888880565632
渲染输出单元数量48484832323216
加速频率 (MHz)1770178517851725166515901785
基础频率 (MHz)1500153015301530148514101740
标准显存配置6GB GDDR66GB GDDR66GB GDDR54GB GDDR64GB GDDR54GB GDDR64GB GDDR6
显存位宽192 bit192 bit192 bit128 bit128 bit128 bit64 bit
显存带宽 (GB/sec)288336192192192192128
一级缓存 (KB) (per SM)64 KB64 KB64 KB64 KB64 KB64 KB64 KB
二级缓存 (MB)1.5 MB1.5 MB1.5 MB1 MB1 MB1 MB1 MB
最高 GPU 温度 (℃)95939590929494
显卡总功耗 (W)120125120100757575
要求的系统功率 (W) (8)450450450350300300300
所需电源接口8-pin8-pin8-pin6-pin6-pin6-pin6-pin

NVIDIA GeForce RTX 10 Series 规格


架构:Pascal
发布时间:2016
制造工艺:Samsung 16 nm


关键参数GTX 1080 TiGTX 1080GTX 1070 TiGTX 1070GTX 1060GTX 1050 TiGTX 1050
发售价格 (美金)$120.00$72.00$72.00$72.00$72.00$33.00$33.00
晶体管数量 (亿)471314312314314132132
晶粒面积 (mm2)699599449379249139109
每秒 FP32 运算次数 (TFLOPS)10.618.237.825.783.861.981.73
SM 数量282019151065
CUDA Core 数量353842560243219201280768640
纹理映射单元数量224160152120804840
渲染输出单元数量88646464483232
加速频率 (MHz)1582173316831683170813921455
基础频率 (MHz)None160716071506150612901354
标准显存配置11 GB GDDR5X8 GB GDDR5X8 GB GDDR58 GB GDDR56 GB GDDR5X4 GB GDDR52 GB GDDR5
显存位宽352256256256192128128
显存带宽 (GB/sec)484320256256192112112
一级缓存 (KB) (per SM)48 KB48 KB48 KB48 KB48 KB48 KB48 KB
二级缓存 (MB)2.782221.511
最高 GPU 温度 (℃)91949494949797
显卡总功耗 (W)2501801801501207575
要求的系统功率 (W) (8)600500500500400300300
所需电源接口6-pin + 8-pin8-Pin8-Pin8-Pin6-PinNoneNone

NVIDIA GeForce RTX 9 Series 规格


关键参数GTX 980 TiGTX 980GTX 970GTX 960GTX 950
发售价格 (美金)$80.00$52.00$52.00$29.40$29.40
晶体管数量 (亿)601398398227227
晶粒面积 (mm2)649549329199159
每秒 FP32 运算次数 (TFLOPS)5.634.613.492.311.57
SMM 数量22161386
CUDA Core 数量2816204816641024768
纹理映射单元数量1761281046448
渲染输出单元数量9664563232
加速频率 (MHz)10761216117811781188
基础频率 (MHz)10001126105011271024
标准显存配置6 GB GDDR54 GB GDDR54 GB GDDR52 GB GDDR52 GB GDDR5
显存位宽384256224128128
显存带宽 (GB/sec)336224196112106
一级缓存 (KB) (per SMM)48 KB48 KB48 KB48 KB48 KB
二级缓存 (MB)321.7511
最高 GPU 温度 (℃)9298989895
显卡总功耗 (W)25016514512090
要求的系统功率 (W) (8)600500500400350
所需电源接口6-pin + 8-pin2x6-Pin2x6-Pin6-Pin6-Pin

码字不易,若觉得本文对你有用,欢迎点赞

标签:2024.12,显存,pin8,KB128,GB,GeForce,NVIDIA,RTX,数量
From: https://blog.csdn.net/gumc123/article/details/144304337

相关文章

  • Diray - 2024.12.06
    Lamanya-DRE4M1N9好听。那我缺的くるぶっこちゃん-其は万花の夢を見る谁来给我补阿。虽然我是个啥比社恐所以没打过街机音游,中二这些根本没了解过。但是还是喜欢callionet一些,我觉得这个歌,情感很饱满阿!感觉他的歌我一直都挺喜欢的。从最先arcaea的PrimevalTextu......
  • 2024.12.5 周四
    2024.12.5周四Q1.1000给定x2~xn(<=500),构造a1~an,满足i:2~n,x[i]==a[i]%a[i-1]。Q2.1200n户人家在一条线上,现在在某两户i,i+1之间/两端修建一条公路,给定一01串:0代表希望在公路左边,1则相反。要求两侧都要有至少一半人家满意。多解则:i尽量距离中间人家最近,如仍多解则选取......
  • 2024.12.5——攻防世界xff_referer
    知识点:XFFreferer一、知识点详情1.XFF(1)介绍X-Forwarded-For(简称XFF)是一个HTTP请求头部字段,它用于表示HTTP请求的客户端IP地址,尤其是当请求通过一个中介代理或负载均衡器时。该字段的值通常是一个逗号分隔的IP地址列表,其中第一个IP地址是最初连接到中介代理或......
  • Diary - 2024.12.05
    哥我真的佩服你了,,,你说物理老师上完课说的给一两天整理的意思又没有可能是指拿时间整理一下然后等老师来讲,而不是做完作业直接开跑看课,然后让大家追赶你的步伐,,,有点流汗了,感觉现在一天学了好多脑子要爆掉了,然后我还得快点做作业来跟上你看课的速度,,,哥我错了,我是菜比行吗,,,在您的引......
  • 2024.12.4 周三
    2024.12.4周三Q1.1000给定01串,操作:选择l,r,将s[r]放到s[l]前:s[l]s[l+1]...s[r-1]s[r]->s[r]s[l]s[l+1]...s[r-1],代价为r-l+1/区间长度。问最小代价将01串由小到大排序。Q2.1300给定2行'<''>'组成的字符串,起点[1,1],可选4个方向走一步,然后必须根据所在字符走一步。问是......
  • 2024.12.4~2024.12.8
    2024.12.4刚回到北京,呃NOIP也过去了,在家也摆烂了一段时间了,也该做出些调整了怎么说呢,NOIP之前做的计划,虽然并没有严格遵守下去,但也是起到了一个推波助澜的效果的并且计划中的一些条目到目前还适用,所以我就不做什么大的删改,主打的就是一个继承约法n章(省选版):1.作息:6:00起床,7:......
  • 2024.12.3 周二
    2024.12.3周二Q1.1100给定两个长度为n和n+1的数组a,b。每次操作:选择a的任意一个数+1/-1/复制到末尾。问将a变成b的最小操作次数。Q2.1200设定一个数组是美丽的:当其可以通过任意次操作将数组里的数变成同一个数字,操作:如果a[i-1]==a[i+1],则可使a[i]=a[i-1]。问删除数组......
  • 2024.12.3
    //计算每个人的平均成绩JavaPairRDD<String,Double>averages=scores.join(counts).mapValues(newFunction<Tuple2<Integer,Integer>,Double>(){@OverridepublicDoublecall(Tuple2<Integer,Integer>tuple){return(double)tu......
  • 2024.12.2 周一
    2024.12.2周一Q1.1100给定一个数字(32位以内),使用1,0,-1构造二进制数位,同时保证不能有相邻的非0数存在。Q2.1200给定2个相同数位的数(<=1e100),任意操作:交换2数中相同位的数字使两数之积最大。Q3.1300前缀后缀板题Q4.1400给定n,m(<=2e6)。a:1n,b:1m,问:满足a+b是b*g......
  • 2024.12.3(周二)
    #导入必要的库fromsklearnimportdatasetsfromsklearn.model_selectionimporttrain_test_split,cross_val_score,StratifiedKFoldfromsklearn.svmimportSVCfromsklearn.metricsimportaccuracy_score,precision_score,recall_score,f1_score,classification......