谷歌最强 AI 平台:第七代 TPU 架构 Superpod 曝光,9216 个芯片 + 192GB HBM

时间:2025-08-26 10:24:01来源:互联网

下面小编就为大家分享一篇谷歌最强 AI 平台:第七代 TPU 架构 Superpod 曝光,9216 个芯片 + 192GB HBM,具有很好的参考价值,希望对大家有所帮助。

alixixi 8 月 26 日消息,科技媒体 WccfTech 昨日(8 月 25 日)发布博文,报道称在 Hot Chips 2025 大会上,谷歌详细披露第七代 TPU 架构“Ironwood”超级计算平台。

alixixi援引博文介绍,谷歌于今年 4 月官宣第 7 代 TPU 架构,代号为 Ironwood,号称其性能是当前最强大超级计算机的 24 倍。

本次披露主要聚焦单个 Superpod 的硬件构成与架构设计。相比 2022 年的 TPU v4(4096 芯片、32GB HBM、275 TFLOPs)和 2023 年的 TPU v5p(8960 芯片、95GB HBM、459 TFLOPs),Ironwood 在核心规格上大幅跃升。

单个 Ironwood Superpod 集成 9216 枚芯片,每片配备 192GB、带宽 7.4TB/s 的高带宽存储,峰值算力高达 4614 TFLOPs,意味着其单芯片性能较 TPU v4 提升超过 16 倍。

每四颗芯片组成一块 PCBA 主板,16 块主板构成一个机架,共 64 芯片节点,谷歌采用 InterChip Interconnect(ICI)技术,将多达 43 个 64 芯片模块互连,构建出拥有 1.8PB/s 网络带宽的集群。

在物理布局上,Ironwood 沿用过去三代的 3D Torus(立方环网)拓扑,每个逻辑单元为 4×4×4 节点阵列,即 64 芯片,封装于单个机架。

一个 Superpod 包含 144 个机架,还配备光学交换机机箱以实现跨模块互连,以及用于液冷的冷却分配单元(CBU)机架,互连方面为提高灵活性与可扩展性,采用 PCB 走线、铜缆和光纤的混合方式。

在机架设计上,顶部设有泄漏检测盘以监控液冷系统,下方是供电模块,具备两路电源域,将 416V 交流电经整流转换为直流电。整套系统支持液冷散热,满载运行功率可超过 100kW。

alixixi简要介绍下上述专有名词:

TPU(Tensor Processing Unit)张量处理单元:谷歌专为机器学习任务设计的专用芯片,优化矩阵运算性能。

Superpod,就是一组连续的 TPU,通过专用网络组合在一起。

HBM(High Bandwidth Memory)高带宽存储:一种集成在芯片附近的高速显存,显著提升数据传输速率。

TFLOPs(Tera Floating Point Operations per Second)万亿次浮点运算 / 秒:衡量芯片浮点运算性能的指标。

本站部分内容转载自互联网,如果有网站内容侵犯了您的权益,可直接联系我们删除,感谢支持!