出货和节奏:英伟达的卡全年125-130w张(纯A100),整个ai服务器训练增加比较多,今年A100为主,A800今年供应还是比较大的问题的,预计今年A800在今年第四季度,10w张左右;
A100:第一季度出货量比较少,按照台积电的产能,按照货期2-3个月(芯片离开台积电到板卡厂商需要的时间,目前看芯片在台积电生产1-1.5个月能做完,时间比较快,所以合计生产到板卡厂商需要4个月,所以第一季度的就能反应到二季度上),第一个季度出的去年的卡,第二季度开始是今年新生产的分季度销量预期:Q1 10w张,Q2 35w张,Q3 40w张,Q4 43w张,这是目前看到市场的英伟达的出货量;
H100:预计今年出货53-55w张,看到今年Q1 2.5w张,Q2 不到5000片,Q3 26w片,Q4 27w片;今年H800没看到出货量;合计180w张,10-15w张是库存,wafer 55-60k的晶圆片;
去年出货:A100 46w张;
二季度出货量和英伟达业绩指引之间的差异:还没算推理卡,T4 205-210w张,分季度不太清楚;明年到F4和F40,明年推理320-330w张;明年训练卡的比例会增加,推理卡的比例会下降
价格:A100英伟达出货价格9000-1w美金/ 张,板卡,H100 2.8-2.9w美金/张,板卡;我们代工6300-6400美金的价格给英伟达,台积电封装好的芯片6000美金,PCB 60美金,模组 50美金,外面的铁壳 40-50美金,我们加工费150美金左右,然后英伟达给终端客户9000-1w美金;我们的利润在100美金左右;
H100 :卖给英伟达1.3-1.4w美金;
bom:芯片1.3w美金,pcb 80美金,模组 75美金,铁壳40美金,加工费250美金不到300美金,我们的利润180-200美金/片;
明年预计H100会有20-25%的跌幅。
明年出货:训练服务器增速很快,A100 差不多也是130w,H100 3-4x的增加到150-200w,A+H 330-340w片;A800 20-30w张,合计370w左右的片;这个数字是英伟达给我们的,10月份会再次确定;
服务器:AI 45W台70%是推理服务器, 30-31是推理服务器,剩下的是15w台是训练服务器;明年预计增幅80%81-82w,训练占比60% 49w台,推理32-33w台;云厂商的份额;数据来源是客户的增速预估,24年到25年60%,到26年增速恢复正常;服务器折算成卡,占英伟达的60%训练8卡,推理是4卡对应关系;明年训练卡的比例会增加,推理卡的比例会下降,今年推理卡和训练卡的比例是7:3,明年 6:4;所以推理卡的增速是略慢于服务器的增速,训练卡的增速高于服务器的增速。
客户结构:从今年看,某些客户,比如微软的推理服务器的占比已经在下调,亚马逊和google推理和训练比例是7:3;
H100服务器的boom:2颗CPU,1250美金/颗,GPU H100 8张,价格2.8w-2.9w美金/张,内存180美金/条 32条,pca板 480美金/每块,SSD存储500美金 20颗,机箱 200美金,光模块+光纤 1500美金/组,8组,目前用400g,电源500美金 4个;
中国客户:今明出的很少;
明年81-82w台服务器:中国占比15%,剩下85%全是北美客户;
如何看各种新闻腾讯和字节下单很多张卡的新闻?对于我们现在看到的腾讯字节也好,下了10w张卡,还没从英伟达那边拿到相对比较精准的信息,英伟达但凡有加单我们比较清楚,我们代工A100和H100服务器,目前比较明确的BBAT这四家给英伟达下了10wA800,预计在第四季度交付,明年比较明确的是字节是7w A800,腾讯还没看到,在国内A800需求量最大的还是BBAT,特别是字节,在国内的发展速度是非常快的,阿里相对也比较大5-6w 张,腾讯和百度A800不会有特别大的提 升,维持在每家4-6w张左右;
24年130W A100客户拆分:A明年出货量在互联网行业会下降到40-50%,另外60%会给中小客户和渠道客户,A100的卡,预计在25年会被H100替代;
推理卡的价格:3000美金/颗;
卡:包含工业富联自己做ai服务器的卡GH200和DGX明年的量:GH200目前看到量很少,目前我们就只做芯片的代工,整机是广达在做;DGX今年出货量7000台,明年英伟达给我们的预估指引1-1.1w台;
代工利润率:推理服务器和a100的服务器净利润率基本在4-6%(整机售价的), H100基本在7-9%;
光模块:插拔式,在sever上给到H100对外通讯的通道模块(所以算在boom里面了),H100服务器8个,上游交换机也要配光模块,普通服务器就不需要了;
未来比如25年后推理和训练服务器比例:26年开始恢复正常推理和训练7:3附近;finisar 英伟达加单200w如何看:光模块和我们没太多联系,我们更多是做板块,是新加的,我们会有部分新加的,对应 DGX也加了,GH200也应该加了;对应20w台的;广达那边对gh200很乐观;客户是基本都是头部客户;H100服务器28- 30w美金,gh200服务器30w+,很贵,所以还是头部客户;
本文选自微信公众号:SEVEN调研纪要。智通财经编辑:张计伟。