9 月 6 日消息,在上周的 Hot Chips 2025 大会上,谷歌压轴展示了其最新一代 TPU“Ironwood”,并公布了配套超级计算机的技术细节。
注:Ironwood 发布于今年 4 月,属于第七代 TPU 硬件。作为谷歌首款专为大规模推理负载设计的 TPU,Ironwood 集成双计算核心,FP8 精度算力达 4,614 TFLOPs,并配备 192GB HBM3e 显存,可提供 7.3TB/s 带宽。
系统架构层面,Ironwood 的 I/O 带宽达 1.2TB/s,单个系统能够扩展至 9,216 枚芯片,整体性能最高可达 42.5 ExaFLOPS。
同时,这一系统实现了 1.77PB 的共享内存,打破了此前共享内存超级计算机的容量纪录。此外,该系统还能在节点故障时重新配置,并通过检查点恢复任务。
Ironwood 具备多项稳定性设计,内置可信根、自检功能及静默数据损坏防护机制。同时配备逻辑修复功能以提升制造良率,全架构贯彻可靠性、可用性与可维护性(RAS)设计理念。散热方案采用谷歌第三代液冷基础设施,并由冷板方案支撑。
谷歌称,该芯片在能效上较前代 Trillium 提升一倍,并支持动态电压与频率调节,以适应不同负载。
据称,Ironwood 在设计阶段已应用 AI 技术优化算术逻辑单元电路及布局规划,新增第四代稀疏核心加速嵌入操作与集合通信,支持推荐引擎等负载。
谷歌表示,目前 Ironwood 已在谷歌云数据中心规模部署,但仍作为内部平台,暂不对外部客户直接开放。
相关阅读:
-
《谷歌发布第七代 TPU Ironwood:首度专为 AI 推理设计,能效达 TPU v6e 两倍》