[转帖]芯片相关-- Cpu历史--AMD系列

标签：缓存 -- 锐龙 AMD 转帖浮点处理器 cpu

芯片相关-- Cpu历史--AMD系列
https://zhuanlan.zhihu.com/p/477864185

1.1 AMD

1968 年，仙童半导体的8位创始人中的两位——总经理罗伯特·诺伊斯(Robert Noyce)和实验室负责人戈登·摩尔(Gorden Moore)，带着一部分员工离开了陷入资金危机的公司，成立了英特尔(Intel)。而一年后的 1969 年5月1日，桑德斯（之前在摩托罗拉，后来去了仙童半导体Fairchild Semiconductor）也带着 7 个人另立门户，成立了超微半导体(Advanced Micro Devices, AMD)。

AMD当前处理器分为：服务器霄龙cpu，工作站锐龙线程撕裂者和锐龙pro cpu，嵌入式霄龙，锐龙，R和G系系列嵌入式cpu，笔记本锐龙pro，锐龙和速龙移动cpu，台式处理器锐龙线程撕裂者，锐龙pro，速龙pro，锐龙及搭载显卡的cpu，以及支持chromebook处理器系列

Ø 服务器处理器AMD EPYC（霄龙）:先进的 x86 服务器处理器4树立卓越性能、安全和可扩展性新标准。

Ø 工作站处理器AMD 锐龙 Threadripper PRO，锐龙Threadripper，锐龙PRO：借助拥有超多核心的高性能工作站处理器，轻松应对多线程工作负载。

Ø 嵌入式和半定制处理器AMD EPYC（霄龙）嵌入式，AMD 锐龙嵌入式处理器，R和G系列嵌入式解决方案和半定制。

Ø 笔记本电脑处理器面向企业的 AMD 锐龙 PRO 移动处理器：出色的多核性能和超长电池续航 + 优秀的可管理性和额外安全保护。面向企业的 AMD 锐龙移动处理器：疾速响应、多核性能、卓越能效和超长电池续航。AMD 锐龙移动处理器：超多核心为移动处理器带来卓越性能。AMD 速龙移动处理器：面向主流笔记本电脑打造卓越性能和先进功能。面向学生和老师的 AMD 笔记本电脑：AMD 处理器搭载 Radeon 显卡，带来疾速顺畅的网页浏览和视频播放体验，为在线学习环境赋能助力。

Ø 台式处理器

l AMD 锐龙 Threadripper PRO 处理器：7nm 制程工艺打造出色的 CPU 核心密度，并且支持 128 条 PCIe® 4.0 通道，轻松应对各种专业工作负载。

l AMD 锐龙 PRO 处理器：最多可达8个核心，带来出色的性能、先进的安全功能和无缝的可管理性，轻松应对各种严苛业务环境。

l AMD 速龙 PRO 处理器：专业的安全功能、性能和可管理性，以及卓越的价值。

l AMD 锐龙 Threadripper 处理器助力高端台式机：最多可达 64 核心和 128 线程，让创意工作疾速非凡。

l AMD 锐龙处理器：最多可达 16 核心和 32 线程，最高可达 4.9GHz 的加速时钟频率和最多可达 72MB 的高速缓存，实力打造非凡卓越的性能。

l AMD 锐龙处理器搭载 Radeon 显卡：无需独立显卡，即可享受发烧级性能。

l AMD 速龙处理器搭载 Radeon 显卡：最多可达 4 个先进的“Zen +”3 处理核心和 4 个处理线程，轻松疾速搞定日常办公、网上冲浪和多任务处理。

Chromebook 处理器：

l 面向企业的 AMD Chromebook：性能卓越的 AMD 锐龙和速龙处理器为 Chrome 设备赋能，全面加速企业云计算应用。

l 面向家庭和个人的AMD Chromebook：AMD处理器出色的能效助力打造更轻更薄的 Chromebook，带来超快的连接以及超长的电池续航。

l 面向学生和老师的 AMD Chromebook：Chromebook 助力用户通过各种多媒体应用、STEM 工具、安全功能和精彩创意，深度融入现代教育的方方面面。

https://www.amd.com/zh-hans/processors#%E5%8F%B0%E5%BC%8F%E6%9C%BA

1.1.1 K5

K5是AMD公司1993年开始开发，并于1996年03月27日发布的第一个独立生产的x86级CPU，之前都是跟随intel，例如逆向8080，发布AM9080。当时为了和zilog Z80对抗，1976年和intel签订协议，作为intel的第二供应商，类似代工厂。后面各种巧合，intel给amd授权，AMD也走性价比路线，1985intel撕毁协定，停止了32位处理器80386的授权，AMD告intel，持续四年多，最后胜诉一直追随不是办法。

图1 AMD代工的8088和逆向的386

K5系列: K5系列CPU的频率共有6种: 75 MHz/90 MHz /100 MHz /120 MHz/133 MHz /166 MHz,总线的频率和Pentium差不多，都是60 MHz或者66 MHz。K5采用了高度并行化的 29k RISC 指令集，这与主流的 CISC 指令集大相径庭，但又提供了非常好的 x86 前端。其内部则采用了 4 流水线、5 个整数单元和 1 个浮点单元的设计。为了保证兼容性，K5 能够在奔腾的 Socket 5/7 系列主板上使用。

K5系列 CPU都内置了32 KB的一级缓存，Pentium内置的16 KB，在整数运算和系统整体性能方面要比同样时钟频率的Pentium还要好，但K5上市时间比Pentium（93年3月发布）晚了许多，再加上浮点运算能力远远比不上Pentium，一度使得AMD的市场份额大量丧失。

图2 AMD K5 CPU

K5 的竞争对手是 Intel 的奔腾 Pro 系列（于 1995 年发布）和 Cyrix 的 6x86 系列。整数运算性能大约是奔腾 200 的水平，浮点性能则是奔腾 100 的水平，但击败了 Cyrix 的竞品（当时购买的就是cyrix 200的cpu），还是比较中规中矩的，由于出的较晚，第一次尝试效果一般。

1.1.2 K6-2

硅谷有个60 人的小公司 NexGen，研发的Nx686 处理器轻松地达到了 180MHz 的核心频率，通过比尔盖茨的撮合，与NexGen的创始人Atiq Raza（“微处理器设计领域的迈克尔·乔丹”）建立合作关系，将Nx686 CPU 技术用在K6上，可以直接插在socket7主板上，性能和intel pentun II有一拼，成为公司的转折点。

图3 AMD K6-2 CPU

1.1.3 K7速龙

1999年6月，AMD推出的K7架构处理器比K6更加强势，其主要技术来自DEC公司强大的服务器处理器Alpha 21264，并使用了Alpha架构的EV6总线。与之前的绝大部分非Intel处理器不同，K7架构拥有超越Intel处理器的浮点能力和频率潜力。首款K7处理器被命名为Athlon至今仍是中低端处理器的品牌。

图4 Socket A接口Thunderbird（雷鸟）核心Athlon处理器低端的Duron（钻龙，俗称毒龙）

2001年底，AMD在压力下也推出了新版本的K7处理器进行应对，即Athlon XP，其主要变化是加入了对SSE指令集的支持，以及更高的频率，另外相应的芯片组也开始支持更高带宽的DDR内存，封装基板也从厚重的陶瓷改为了更轻巧、类似Pentium Ⅲ的树脂材质。

图5 树脂基板的Athlon

这种裸die封装方式，出现过散热器压碎cpu die的情况，后来封装都加上了一个金属外壳保护die，但感觉上还是少了些生趣。是不是对安装cpu散热器心有余悸，安装起来怎么别扭怎么来，划伤手都是正常的。但是的散热器鱼龙混杂，没有标准的散热器夹具，有没有装散热器很不顺手的情况，

1.1.4 K8皓龙

2003年8月，AMD推出的K8处理器可以说是一款划时代的产品。基于K7但是又三项改变：

加入了64位指令集，其实64位指令集是intel先提出的并且用在IA64架构安腾（Itanium）处理器上，后来也被迫在消费cpu上也支持64位。

首次集成了内存控制器，最初支持DDR内存，可以大幅度降低内存与处理器的通信延迟，提升系统整体性能

放弃了原有的FSB前端总线而采用了HyperTransport总线技术，它采用点对点串行设计，让内存、磁盘、PCI总线控制器之间有了更高的数据带宽和更大的弹性空间。

除此之外，K8还在K7架构的基础上还加长了整数与浮点流水线，增加了缓存容量，加入温控电路和节能技术，以及增加了对SSE2指令集的支持。第一代K8处理器架构内置单/双通道DDR400内存控制器，一级缓存为128KB，二级缓存为512KB～1024KB。封装上和奔腾4类似加入了金属保护壳，防止压碎。

K8处理器有面向主流市场的Athlon 64、顶级的Athlon 64 FX以及专业级产品Opteron，接口也分为Socket 754和Socket 940两种。

图6 两种封装，后者支持双通道内存

2006年第一季度，AMD处理器10年的繁荣期达到顶峰，在X86市场的份额达到近50%，Intel Pentium 4最终完败。不过此时，笔记本平台上的Intel Pentium M处理器却大获成功。成功往往伴随对手失误。

Tips：2001 年 8 月，Intel 的基于 NetBurst 架构的奔腾 4 系列开始铺货，首批型号代号为 Willamette，频率来到了史无前例的 2GHz。NetBurst 架构的宗旨是采用较长的流水线，通过几乎是暴力提升频率的简单方法来达到提升性能的效果。2005 年 5 月，这次是 Intel，抢先发布了史上第一款双核 CPU：奔腾 D。不过，奔腾 D 是由两颗 P4 的核心共享 FSB 组成，本质上还是没有摆脱高功耗低性能的怪圈。一周以后，AMD 就祭出了自己的双核心处理器：Athlon 64 X2，代号 Toledo/Manchester，制程为 90nm, 吊打了奔腾 D。

1.1.5 AMD Zen

2006年，收购加拿大的显卡企业ATI，从此一蹶不振，后来集中精力游戏主机的关注和新架构ZEN的开发，当前市场上有三大游戏主机，微软Xbox，索尼PlayStation和任天堂Wii都是用AMD处理器。

距K8后的下一次翻身就是zen架构。

Zen的L1缓存在大小和关联性都翻倍了，而且是写回式而不是穿透式。同时采用了非对称 L/S 单元，因为在大多数情况下 load 操作比 store 要频繁得多。指令缓存不再是两个核心共享，同时关联性也翻倍，这将减少缓存未命中的情况。

1.1.6 AMD Zen2

“Zen 2”核心在久负盛名的“Zen”架构之上进行了重大更新。主要优势如下：

时钟周期指令数提升高达 15％2

3 级高速缓存容量翻倍（高达 32MB）

浮点吞吐能力翻倍（256 位）

OpCache 容量翻倍（4K）

Infinity Fabric 带宽翻倍（512 位）

全新的 TAGE 分支预测器

https://www.amd.com/zh-hans/technologies/zen-core

1.1.7 AMD Zen3

Hot Chips 2021大会上AMD发布了Zen3架构处理器

一是提升单线程性能，专业名词叫IPC(每时钟周期指令数)，毕竟之前几代一直追求多核心为主，是时候把单核性能提升到足够的高度了，不然始终是瘸着脚走路，缺乏长久竞争力。

二是在维持8核心CCD模块的前提下，统一核心与缓存，提升彼此通信效率，降低延迟。

三是继续提高能效比，性能提升的同时功耗不能失控。

AMD Zen 3 CCD的尺寸为83.736mm2（11.270 x 7.430mm）。Zen 2 CCD约为72mm2，这使得Zen 3的尺寸比Zen 2大16％。12nmIOD（I/O Die）的尺寸与Ryzen 3000系列相同，为124.29mm2（12.900 x 9.635mm）并使其插入器上最大的芯片。

为此，Zen3架构对于所有模块都进行了翻新，前端、预取、解码、执行、整数、浮点、载入、存储、缓存等等，每个环节都是焕然一新。

首先，Zen3设计了一个堪称艺术级的分支预测器，它之后有两条通道将指令送入队列，然后进行分派，一是8路关联的32KB一级指令缓存和x86解码器，二是4K指令的操作缓存(Op-cache)。

x86解码器的限制是每个时钟周期只能处理最多4条指令，但如果是熟悉的指令，就可以放入操作缓存，每个周期就能处理8条，二者结合指令分发效率就大大提升，相比于Zen2直接上升了一个档次。

指令分派之后就来到执行引擎阶段，分为整数、浮点两大部分，每个时钟周期可以向它们分派6条指令。

其中，整数单元还是4个，但更加分散，并增加了一个单独的分支与数据存储单元，提升吞吐量，每时钟周期可以生成3个地址。

浮点方面则分为六条流水线，进一步提升吞吐量和效率。

内存方面，每时钟周期可以执行3个载入，或者1个载入加2个存储，再次提升吞吐量，并且可以更灵活地处理不同工作负载。

图7 Zen2对比Zen3

前端方面，主要有容量翻番的L1 BTB、更大的分支预测器带宽、更快的预测错误恢复、更快的操作缓存拾取、更精细的操作缓存流水线切换，等等。

执行引擎方面，主要有独立的分支与数据存储单元、更大的整数窗口、更低的特定整数/浮点指令延迟、6宽度拾取与分发、更宽的浮点分派、更快的浮点FMAC(乘法累加器)，等等。

载入/存储方面，主要有更高的载入带宽(2个变3个)、更高的存储带宽(1个变2个)、更灵活的载入/存储指令、更好的内存依赖检测，等等。

https://news.mydrivers.com/1/722/722438.htm

世间本没有魔法，只是我们还不了解，导致让它看起来像有魔法一样。

下期预告：

除了我们常见的Intel和amd外，另外在通用cpu舞台上，还有哪些过客或目前在某些特殊领域依旧在发挥价值的公司和cpu种类。

上期回顾：

标签：缓存,--,锐龙,AMD,转帖,浮点,处理器,cpu
From： https://www.cnblogs.com/jinanxiaolaohu/p/18109769