微软推出了其最新的 Azure 虚拟机,即针对 AI 超级计算进行了优化的 ND H200 v5 系列。

随着 AI 领域的快速发展,对可扩展、高性能基础设施的需求持续呈指数级增长。微软的客户依靠 Azure AI 基础设施来开发创新的 AI 驱动解决方案,这就是该公司推出采用 Azure ND H200 v5 系列虚拟机 (VM) 构建的新型基于云的 AI 超级计算集群的原因。这些 VM 现已正式发布,旨在处理从基础模型训练到生成式推理等高级 AI 工作负载日益增长的复杂性。

ND H200 v5 最有趣的方面之一是它能够解决 GPU 的原始计算能力以比连接的内存和内存带宽快得多的速度增长所造成的瓶颈。ND H200 v5 系列 VM 提供了高带宽内存 (HBM) 容量和带宽的显著提升,使 GPU 能够更快地访问模型参数。这可以减少应用程序的整体延迟,这对于交互式代理等实时应用程序至关重要。

此外,ND H200 v5 VM 可以在单个 VM 的内存中容纳更复杂的大型语言模型 (LLM)。这消除了在多个 VM 上运行分布式作业的需要,从而提高了性能并降低了复杂性。

最后,ND H200 v5 与 Azure Batch、Azure Kubernetes Service、Azure OpenAI Service 和 Azure Machine Learning 等 Azure 服务预先集成。这些集成使企业可以轻松上手使用新的 VM,使其成为希望利用 AI 超级计算能力的组织的诱人选择。