面向 AI 优先未来的强大基础设施创新

2024-10-30

Google Cloud

Google Cloud 宣布了面向 AI 优先未来的强大基础设施创新，包括第六代 TPU Trillium、采用 NVIDIA H200 Tensor Core GPU 的 A3 Ultra VM、Hypercompute 集群、基于定制 Axion 处理器的 C4A VM、对 Jupiter 数据中心网络和 Titanium 主机卸载功能的增强以及 Hyperdisk ML 存储服务。这些增强功能旨在提高 AI 基础设施的性能、易用性和成本效益。Trillium 提供了比 TPU v5e 显着的性能改进，包括训练性能提高 4 倍以上，推理吞吐量提高 3 倍，能效提高 67%。A3 Ultra VM 旨在提供比前几代显着的性能提升，GPU 到 GPU 的网络带宽提高了 2 倍，LLM 推理性能提高了 2 倍。Hypercompute 集群简化了 AI 加速器集群的管理，支持通过单个 API 调用进行可靠且可重复的部署。C4A VM 现已正式发布，为各种通用工作负载提供了更高的性能和效率。Titanium 和 Jupiter 网络得到了增强以支持 AI 工作负载，新的 Titanium ML 网络适配器通过 RoCE 提供 3.2 Tbps 的 GPU 到 GPU 流量。Hyperdisk ML 现已正式发布，为 AI 和 HPC 工作负载提供高性能存储，数据加载时间更短，成本效益更高。

面向 AI 优先未来的强大基础设施创新

Recommends