华金证券:云端计算进入高性能计算时代 大模型训练仍以GPU为主

79 3月27日
share-image.png
张计伟

智通财经APP获悉,华金证券发布研究报告称,云端计算进入高性能计算时代,大模型训练仍以GPU为主。该行判断GPU仍将是训练模型的主流硬件:1)Transformer架构是最近几年的主流,该架构最大的特点之一就是能够利用分布式GPU进行并行训练,提升模型训练效率;2)ASIC的算力与功耗虽然看似有优势,但考虑到AI算法还是处于一个不断发展演进的过程,用专用芯片部署会面临着未来算法更迭导致芯片不适配的巨大风险;3)英伟达强大的芯片支撑、生态、算法开源支持。

建议关注:瑞芯微(603893.SH)、晶晨股份(688099.SH)、星宸科技(待上市)、全志科技(300458.SZ)、北京君正(300223.SZ)、中科蓝讯(688332.SH)、富瀚微(300613.SZ)、恒玄科技(688608.SH)。

华金证券主要观点如下:

在芯片算力快速提升、日趋庞大的数据量共同支撑下,AI算法迭代升级加速。

AI的发展经历了很长时间的积累,其能不断跨越科学与应用之间的鸿沟主要得益于技术突破、行业落地、产业协作等多方面的推动,而技术突破是其中最为关键的要素。从起步阶段发展到当下深度学习阶段,算法、数据和算力构成了AI三大基本要素,并共同推动AI向更高层次的感知和认知发展。算法方面,目前深度学习仍然是AI技术发展的主导路线,但是早期所使用的有监督学习方式由于受限于对大量标注数据依赖与理解能力缺乏,而且模型通用性较差,正逐步被新的技术所取代,在芯片算力的快速提升、日益庞大的数据量这两者的支撑下,新算法正处于加速迭代升级过程中。

自监督学习的算法模型快速发展,“预训练+精调”的开发范式迈向成熟,新一轮AI技术产业化之路开启。

谷歌、脸书等多家企业先后发布使用自监督学习的算法模型,通过挖掘无标注数据的监督信息,减少人为干预。现阶段自监督学习本质上仍依赖规范化、标签化的数据,主要借助预训练模型构筑并学习数据特征。“预训练”的做法一般是将大量低成本收集的训练数据放在一起,经过某种预训方法去学习其中的共性,然后将其中的共性“移植”到特定任务的模型中,再使用相关特定领域的少量标注数据进行“微调”,这样的话,模型只需要从“共性”出发,去“学习”该特定任务的“特殊”部分即可。

预训练模型成功的关键是自监督学习与Transformer的结合。预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性,用户基于大模型通过零样本、小样本学习即可获得领先的效果,同时“预训练+精调”等开发范式,让研发过程更加标准化,显著降低了人工智能应用门槛。整体上来看,关于本轮AI技术突破所带来的产业化变局,该行有三个核心观点:1、基于GPT为代表的大模型AI的通用能力,未来几年大模型AI的渗透广度、深度和速度有可能会超预期;2、ChatGPT采用的是闭源模型,其加速的产业落地会刺激更多的厂商加大大模型AI的研发投入,进而推动AI产业化发展;3、大模型AI通用能力的提升,带动的将不仅仅是云计算市场的增长,伴随着多种技术与商业化路径的逐步成熟,云、边缘、端的增量市场空间均有望渐次打开。

云端计算进入高性能计算时代,大模型训练仍以GPU为主。

虽然AI芯片目前看有GPU、ASIC、CPU、FPGA等几大类,但是基于几点原因,该行判断GPU仍将是训练模型的主流硬件:1、Transformer架构是最近几年的主流,该架构最大的特点之一就是能够利用分布式GPU进行并行训练,提升模型训练效率;2、ASIC的算力与功耗虽然看似有优势,但考虑到AI算法还是处于一个不断发展演进的过程,用专用芯片部署会面临着未来算法更迭导致芯片不适配的巨大风险;3、英伟达强大的芯片支撑、生态、算法开源支持。

模型小型化技术逐步成熟,从训练走向推理,云、边、端全维度发展。

该行认为至少有四大投资主线应持续关注:1、GPU方面,在英伟达的推动下,其从最初的显卡发展到如今的高性能并行计算,海外大厂已经具备了超过20年的技术、资本、生态、人才等储备,形成了大量的核心技术专利,而且也能充分享有全球半导体产业链的支撑,这都或是目前国内厂商所缺失的。近几年在资本的推动下,国内涌现出数十家GPU厂商,各自或都具备一定的发展基础,但整体经营时间较短,无论从技术积淀、产品料号布局、高端料号性能来说,与国外大厂仍具备较大差距。

但国产化势在必行,国内相关产业链重点环节也积极对上游芯片原厂进行扶持,国产算力芯片需要不断迭代以实现性能的向上提升,后续持续关注相关厂商料号升级、生态建设和客户突破;2、AI在端侧设备应用普及是大势所趋,目前,知识蒸馏、剪枝、量化等模型小型化技术在逐步成熟,AI在云、边、端全方位发展的时代已至。除了更加广泛的应用带来需求量的提升外,更复杂算法带来更大算力的需求也将从另一个维度推动市场扩容;3、数据的高吞吐量需要大带宽的传输支持,光通信技术作为算力产业发展的支撑底座,具备长期投资价值;4、Chiplet技术可以突破单一芯片的性能和良率等瓶颈,降低芯片设计的复杂度和成本。基于向Chiplet模式的设计转型,已经是大型芯片厂商的共识,相关产业链具备长期投资价值。

风险提示:技术创新风险、宏观经济和行业波动风险、国际贸易摩擦风险。

相关阅读

全志科技(300458.SZ)发布2022年度业绩,净利润2.11亿元,下降57.31%,拟10股派1.5元

3月20日 | 杨跃滂

瑞芯微(603893.SH)高管王海闽累计减持2.52万股

3月10日 | 皮腾飞

晶晨股份(688099.SH)拟推不超490万股限制性股票激励计划

3月8日 | 皮腾飞

瑞芯微(603893.SH)主要股东润科欣累计减持195.81万股

3月7日 | 詹进港

北京君正(300223.SZ)股东武岳峰集电减持299.64万股 减持期限已满

3月1日 | 郑少波