首页 > 其他分享 >简单谈谈Google TPUv6

简单谈谈Google TPUv6

时间:2024-10-26 18:43:59浏览次数:5  
标签:ICI Google TPU TPUv5e 谈谈 所示 TPUv6

简单谈谈Google TPUv6 根据Google TPU第六代的数据做了一些性能数据的对比,需要注意的是TPUv6当前应该是一个用于训推一体的单Die的版本,用于训练的V6p双Die版本应该会后期再发布. 需要注意的是在国内外都开始卷大模型推理价格的时候, TPU这样的东西对于提高ROI非常有帮助。快速浏览手Google TPU版本,见表2-21。 表2-21 快速浏览手Google TPU版本

 

v4

v5e

v5p

v6e

每个pod的芯片数

4096

256

8960

256

chip bf16 TFLOPS

275

197

459

926

HBM(GB)

32

16

95

32

HBM BW(GB/s)

1228

820

2765

1640

每个芯片的ICI BW (Gb/s)

2400

1600

4800

3200

TPUv6的主要的几个优化点是MXU更大频率更高,浮点能力基本上到H100,HBM带宽和容量翻倍换了HBM3,ICI带宽也升级了。TPU互联拓扑应该和TPUv5e是一致的,如图2-38所示。   图2-38 ve5中的TPU主机框架 TPUv5e的物理结构如下,四片一块板上互联,剩余的ICI拉出到OCS光交换机上,如图2-39所示。 图2-39 TPUv5e的物理结构,四片一块板上互联,剩余的ICI拉出到OCS光交换机上 一个比较关键的点是SparseCore的升级,老的SparseCore架构,如图2-40所示。   图2-40 稀疏核硬件结构 与GB200直接C2C连接一个Grace不同的是,Google采用了在TPU内置标量核的方法,在相应的性瓦比上会比NV更有优势。TPU ve5有效缩放因子,如图2-41所示。   图2-41 TPU ve5有效缩放因子 另外Google这套东西很值得借鉴的是它在TPUv5e开始,e系列负责训推一体,Pod规模不会很大,部署更加灵活,而p系列则负责更大规模的Foundation Model训练任务.。Pathways的调度机制也维持了很好的线性加速比,例如TPUv5e可以做到50000卡基本线性加速。

标签:ICI,Google,TPU,TPUv5e,谈谈,所示,TPUv6
From: https://www.cnblogs.com/wujianming-110117/p/18504334

相关文章

  • webRTC搭建:STUN 和 TURN 服务器 链接google的有点慢,是不是可以自己搭建
    如果使用Google提供的STUN/TURN服务器速度较慢,你完全可以自己搭建STUN和TURN服务器。这有助于提升网络连接速度和稳定性,特别是在需要穿透NAT或防火墙的网络环境下。下面是如何自己搭建STUN和TURN服务器的具体步骤:1.选择TURN/STUN服务器软件推荐使用Cot......
  • 阿里巴巴推出升级版AI翻译工具:Marco MT 性能超越Google、DeepL和ChatGPT
    阿里巴巴的国际业务部门于推出了一款升级版的AI翻译工具,名为MarcoMT。这款工具在翻译性能上超越了Google、DeepL和ChatGPT的同类产品。该工具的目标是帮助商户更好地在全球市场销售,尤其是在跨境电商领域,通过更加精准的翻译增强商户的国际竞争力。基于大语言模型:MarcoMT使......
  • 更改Google谷歌浏览器安装位置
    谷歌浏览器默认是安装C盘的,越用占用的空间越大,所以需要手动迁移到非系统盘。1、在官网下载安装包:GoogleChrome网络浏览器2、下载后,双击安装,默认安装到C盘里面的,中途不能自定义安装。3、安装好后会在桌面生成一个谷歌浏览器的快捷方式:将鼠标移到谷歌浏览器快捷方式图标上→......
  • 并发面试题-谈谈你对AQS的理解
    简要回答AQS(AbstractQueuedSynchronizer抽象队列同步器)是Java并发包中的一个核心组件,它提供了一个框架用于实现基于FIFO等待队列的阻塞锁和同步器。AQS通过管理一个同步状态和一个等待队列来控制多线程对共享资源的访问。它定义了一系列模板方法,如tryAcquire、tryRelease等,供......
  • Protocol Buffer Error on compile during GOOGLE_PROTOBUF_MIN_PROTOC_VERSION check
    ProtocolBufferErroroncompileduringGOOGLE_PROTOBUF_MIN_PROTOC_VERSIONcheck出现这个问题一般是安装了多个版本protobufhttps://stackoverflow.com/questions/35744529/protocol-buffer-error-on-compile-during-google-protobuf-min-protoc-version-checkhttps://b......
  • 在Linux命令行下载Google Drive大文件(解决Google Drive下载慢的问题)
    文章目录1、使用gdown命令2、复制链接3、替换为Linux下载链接注意:在Linux命令行进行1、使用gdown命令wget只能下载小文件,大文件需要用到gdownpipinstallgdown#如果不能够直接安装,使用以下命令gitclonehttps://github.com/wkentaro/gdowncdgdownpipin......
  • 【数字化转型到底转了啥?】学习华为HCIP认证后谈谈华为的数字化转型
     背景: 最近正在学习华为HCIP认证相关课程,其中第一讲就是关于企业架构和数字化转型的课程。谈一谈总结和感想,华为的数字化转型,真的就像是一次华丽的蜕变,他们通过数字化转型,把业务都重新梳理了一遍,让效率变得超级高,客户体验也变得超级棒。这种变革,真的让人感受到了数字化转型......
  • 使用 `com.google.gson` 库将 Java 对象转换为 JSON 字符串,并且确保 `data` 字段是 `M
    要使用com.google.gson库将Java对象转换为JSON字符串,并且确保data字段是Map<String,Object>类型的,你可以按照以下步骤编写一个示例代码。这个示例代码将创建一个包含data字段的Java对象,并将data字段初始化为一个Map<String,Object>,然后动态地向其中添加......
  • 在K8S中,什么是 Google 容器引擎?
    在Kubernetes(K8S)生态中,Google容器引擎(GoogleKubernetesEngine,简称GKE)是一个重要的组成部分。以下是对Google容器引擎的详细介绍:1.定义与背景Google容器引擎是GoogleCloud提供的一种托管式的容器化应用程序部署和管理解决方案。它基于Kubernetes,这是一个开源的容器编排平台,......
  • 7个提升Google搜寻排名的SEO技巧(Google RankBrain)
    GoogleRankBrain是一种搜寻引擎演算法,GoogleRankBrain是基于人工智慧来自动判断搜寻者的搜寻意图,同时也将网页概念化,利用动态排序方式来对应搜寻关键字与搜寻结果,使其显示最佳的搜寻结果,我们在GoogleRankBrain权威指南当中非常详尽的解释GoogleRankBrain的运作原理,......