集成10万个H100 GPU! 马斯克启动超级AI集群项目 欲打造全球“最强大人工智能”

510 7月23日
share-image.png
卢梭 智通财经资讯编辑

智通财经APP获悉,特斯拉CEO兼AI领域初创公司xAI创始人马斯克 (Elon Musk) 正式启动建设“世界上最强大的AI训练集群”的这一庞大人工智能超算系统项目,目标是推动xAI在12月之前打造出“世界上最强大的人工智能(AI)”,该AI超算系统将由10万个英伟达 H100 AI GPU倾力打造。有科技行业人士评论称,待英伟达新推出的“地表最强性能”Blackwell架构AI GPU于第四季度成功发货之后,xAI可能将是第一批试用该AI GPU的客户。

据了解,马斯克在社交媒体X(前身为推特)上连续发帖,强调他创立的初创公司xAI启动了“世界上最强大的AI训练集群”项目,他力争在今年12月之前利用该AI训练集群创建出他所谓的“世界上最强大的人工智能”。X帖子上写道:今天,xAI位于孟菲斯的超级AI集群开始使用100,000个基于液冷的英伟达 H100 GPU进行AI训练,这些GPU与单一的RDMA(远程直接数据存取)结构相连。

据了解,AI服务器领域领导者超微电脑(SMCI.US)为xAI这一超级AI集群项目提供大部分基础硬件设施,该公司首席执行官Charles Liang也在马斯克的帖子中发表评论,吹捧xAI团队的强大执行力。此前,Charles Liang曾对马斯克倾力打造的液冷模式人工智能数据中心大加赞赏。

超微电脑的大型客户集中于ChatGPT以及Sora开发者OpenAI以及众多AI领域初创公司,其中就包括马斯克创立的xAI,还包括甲骨文以及亚马逊AWS等云服务巨头。由于超微电脑长期以来与英伟达合作关系密切,因此深度绑定英伟达的这两家公司依靠着自身强大的供应链以及与英伟达长期合作关系,往往能够获得更大规模的英伟达AI GPU出货量。

超微电脑通过与英伟达的多年来密切合作关系,使用最新的英伟达 GPU以及集成全套CUDA加速工具,为全球企业布局AI技术不可或缺的技术环节——AI训练/推理工作负载,提供强大的GPU加速能力。并且超微电脑在服务器领域长期以来以其定制化服务器解决方案而闻名业内,可以根据客户的特定需求进行硬件配置优化。对于xAI这样的初创公司,这种定制化能力非常重要。

在后续推文中,马斯克解释称,全新的超级AI训练集群将“训练出按各指标衡量的世界上最强大的人工智能”。根据之前的意向声明,有科技行业分析人士猜测xAI的10万 H100 GPU超级集群现在将用于Grok 3超级人工智能大模型训练集群。马斯克表示,改进后的大语言模型(LLM) 预计将在“今年 12 月之前”完成AI训练阶段。

从当前的规模来看,全新的xAI孟菲斯超级AI训练集群在英伟达AI GPU算力规模方面轻松超越了全球500强算力榜单中的任何一项AI算力集群。世界上最强大的超级AI算力体系,如Frontier(37,888个AMD GPU)、Aurora(60,000个英特尔 GPU)以及Microsoft Eagle(14,400个英伟达 H100 GPU),似乎被xAI的AI集群远远甩在后面。

英伟达AI GPU需求仍然火爆! 新一轮股价涨势待发

据了解,在今年5月,有媒体报道称,马斯克计划在2025年秋季之前打造xAI超级算力工厂。当时,马斯克匆忙宣布超级AI训练集群的建设工作,在当时宣布将大举采购英伟达所推出的基于Hopper架构的H100 AI GPU,在当时此举似乎表明,马斯克没有耐心等待英伟达下一代升级版的H200 AI GPU,更不用在当时还未公布交付时间的基于Blackwell架构的B100、B200以及GB 200 AI GPU。

但随着英伟达预计第四季度有望实现首批发货Blackwell架构 AI GPU,一些科技行业分析人士预计马斯克旗下xAI届时将是第一批试用该AI GPU的客户。在3月英伟达新发布的Blackwell架构AI GPU新闻稿中,马斯克就公开喊话称英伟达的AI硬件是“最好的AI硬件”。马斯克还将科技企业的人工智能军备竞赛比作一场高风险的“扑克游戏”,即企业需要每年在人工智能硬件上投入数十亿美元,才能保持竞争力。

英伟达的下一代架构AI GPU——基于Blackwell的AI GPU家族将迎来全新的超高性能提升,亚马逊、戴尔、谷歌、Meta以及微软等科技巨头们将在其最新的数据中心AI服务器系统中大量配置Blackwell AI GPU,华尔街分析师们普遍猜测这些科技巨头对于英伟达硬件的需求将远远超出市场预期。近日有业内人士曝出,由于全球对于英伟达即将量产的Blackwell架构AI GPU需求极为强劲,英伟达已将其与芯片代工巨头台积电的AI GPU代工订单量大幅增加至少25%。

英伟达当前最火爆的AI芯片H100/H200 GPU加速器则基于英伟达突破性的Hopper GPU架构,提供了相比于前代更加强大的计算能力,尤其是在浮点运算、张量核心性能和AI特定加速方面。更重磅的是,基于Blackwell架构的 AI GPU性能远高于Hopper架构,在具有1750亿个参数级别的GPT-3 LLM基准上,Blackwell架构的GB200推理性能是H100系统的7倍,并且提供了4倍于H100系统的训练速度。

正是基于英伟达将于年底前向市场推出新一代Blackwell GPU以及英伟达H100/H200 AI GPU需求仍然无比强劲 ,一些华尔街分析师预计这将刺激英伟达新一轮业绩与股价涨势,因此上调英伟达12个月内目标股价,认为英伟达股价新一轮涨势蓄势待发。

华尔街知名机构Piper Sandler近日重申其对英伟达的“增持”评级,并将12个月内目标价从120美元上调至140美元(英伟达周一收于123.54美元)。另一机构Loop Capital近日将英伟达12个月内目标价从120美元上调至175美元,并维持对该股的“买入”评级。国际大行瑞银重申对英伟达“买入”评级,并将目标价从120美元上调至150美元。

Piper Sandler在一份报告中写道:“调研数据显示英伟达全新Blackwell产品的预订量强劲,并且,现有产品如H100和H200的预订量仍然非常强劲。”Piper Sandler预计,英伟达在截至7月的季度营收将比市场普遍预期高出约20亿美元。在上一季度财报中,英伟达营收比市场预期高出约15亿美元。

相关阅读

沙特阿美向韩国AI芯片制造商Rebellions投资1500万美元

7月23日 | 玉景

海通证券:AI技术蓬勃发展 AI+制药行业潜力巨大

7月23日 | 刘璇

下一代GPU有望刺激新一轮增长 多家华尔街投行上调英伟达(NVDA.US)目标价

7月23日 | 赵锦彬

AI创收效应炸裂! AI软件与云算力需求爆表 SAP(SAP.US)云服务营收猛增25%

7月23日 | 卢梭

股价跌跌不休,港股“AIGC第一股”出门问问(02438)“名不符实”?

7月22日 | 胡湘圆