1.77PB 共享内存创新纪录:谷歌云数据中心已部署 Ironwood TPU,最高可扩展 9216 芯片

时间:2025-09-06 18:24:01来源:互联网

下面小编就为大家分享一篇1.77PB 共享内存创新纪录:谷歌云数据中心已部署 Ironwood TPU,最高可扩展 9216 芯片,具有很好的参考价值,希望对大家有所帮助。

alixixi 9 月 6 日消息,在上周的 Hot Chips 2025 大会上,谷歌压轴展示了其最新一代 TPU“Ironwood”,并公布了配套超级计算机的技术细节。

alixixi注:Ironwood 发布于今年 4 月,属于第七代 TPU 硬件。作为谷歌首款专为大规模推理负载设计的 TPU,Ironwood 集成双计算核心,FP8 精度算力达 4,614 TFLOPs,并配备 192GB HBM3e 显存,可提供 7.3TB/s 带宽。

系统架构层面,Ironwood 的 I/O 带宽达 1.2TB/s,单个系统能够扩展至 9,216 枚芯片,整体性能最高可达 42.5 ExaFLOPS。

同时,这一系统实现了 1.77PB 的共享内存,打破了此前共享内存超级计算机的容量纪录。此外,该系统还能在节点故障时重新配置,并通过检查点恢复任务。

Ironwood 具备多项稳定性设计,内置可信根、自检功能及静默数据损坏防护机制。同时配备逻辑修复功能以提升制造良率,全架构贯彻可靠性、可用性与可维护性(RAS)设计理念。散热方案采用谷歌第三代液冷基础设施,并由冷板方案支撑。

谷歌称,该芯片在能效上较前代 Trillium 提升一倍,并支持动态电压与频率调节,以适应不同负载。

据称,Ironwood 在设计阶段已应用 AI 技术优化算术逻辑单元电路及布局规划,新增第四代稀疏核心加速嵌入操作与集合通信,支持推荐引擎等负载。

谷歌表示,目前 Ironwood 已在谷歌云数据中心规模部署,但仍作为内部平台,暂不对外部客户直接开放。

相关阅读:

《谷歌发布第七代 TPU Ironwood:首度专为 AI 推理设计,能效达 TPU v6e 两倍》

本站部分内容转载自互联网,如果有网站内容侵犯了您的权益,可直接联系我们删除,感谢支持!