简单谈谈Google TPUv6 根据Google TPU第六代的数据做了一些性能数据的对比,需要注意的是TPUv6当前应该是一个用于训推一体的单Die的版本,用于训练的V6p双Die版本应该会后期再发布. 需要注意的是在国内外都开始卷大模型推理价格的时候, TPU这样的东西对于提高ROI非常有帮助。快速浏览手Google TPU版本,见表2-21。 表2-21 快速浏览手Google TPU版本
|
v4 |
v5e |
v5p |
v6e |
每个pod的芯片数 |
4096 |
256 |
8960 |
256 |
chip bf16 TFLOPS |
275 |
197 |
459 |
926 |
HBM(GB) |
32 |
16 |
95 |
32 |
HBM BW(GB/s) |
1228 |
820 |
2765 |
1640 |
每个芯片的ICI BW (Gb/s) |
2400 |
1600 |
4800 |
3200 |