打开APP
微软(MSFT.US)“AI超级工厂“启动!整合数十万GPU,可实现多个数据中心互联
玉景 16:35
阅读量

智通财经APP获悉,微软(MSFT.US)已将其最新的数据中心在亚特兰大上线运营,该中心被微软称为"AI超级工厂",因为它与其他数据中心直接连接,可提供数十万个英伟达(NVDA.US) GPU的算力以支持AI工作负载。

该网络还将支持微软投资的OpenAI。

据微软披露,位于亚特兰大的新一代AI数据中心已于10月投入运营,这是“Fairwater”系列中的第二个设施,并通过专用网络与威斯康星州的首个Fairwater站点相连。该系统整合了数十万个最新NVIDIA Blackwell GPU,构建起全球首个真正意义上的跨州AI计算集群。

微软的“AI超级工厂”概念,核心在于将多个地理上分散的数据中心融合成一个虚拟的单一超级计算机,这与传统数据中心的设计理念截然不同。

微软Azure基础设施总经理Alistair Speirs解释称:“传统数据中心旨在为多个客户运行数百万个独立的应用程序,而我们将此称为‘AI超级工厂’,是因为它在数百万个硬件上运行一个复杂的作业。”这种模式下,不再是单个站点训练一个AI模型,而是由一个站点网络共同支持同一项训练任务。

微软首席执行官萨提亚·纳德拉表示,"Fairwater体现了我们对可互换基础设施群的愿景:能够在任何地方,基于专用加速器和网络路径,以最高性能和效率运行任何工作负载。"

"每个Fairwater数据中心都能将数十万个最新的英伟达GPU集成到一个统一的集群中,"他补充道,"这提供了灵活的基础设施,可以支持全方位的工作负载,并确保没有GPU被不必要的闲置。此外,仅本季度就有超过10万个GB300上线,用于我们其他基础设施群的推理工作。"

"现在训练这些模型所需的基础设施规模不是一两个数据中心,而是其数倍,"微软Azure首席技术官马克·拉西诺维奇表示。

这些数据中心通过专用光缆连接的AI广域网进行互联。

"AI的未来将通过将数据中心连接成统一的分布式系统来塑造,"微软云+AI执行副总裁斯科特·格思里表示。

更多精彩港美股资讯
相关阅读
点击下载