东吴证券:数据将成为AI发展的胜负手 看好三大环节

225 4月18日
share-image.png
张计伟

智通财经APP获悉,东吴证券发布研究报告称,GPT产生的重要能力主要来源于海量数据为基础的大模型训练,未来数据将成为AI发展的胜负手,并有望为中国训练自己的大模型,走出差异化道路提供重要基础。公共和垂直行业数据敏感性高,需要具备央国企背景的厂商参与。看好三个环节:1)数据运营:该行预计医保数据将有望成为公共数据放开的第一站;2)数据基础设施:有望成为最先放量兑现的环节。3)数据安全:该行看好具备央国企背景和数据安全业务积累的相关厂商。

东吴证券主要观点如下:

GPT产生的重要能力主要来源于海量数据为基础的大模型训练。

GPT-3产生了三个重要能力:语言生成、上下文学习、世界知识,这三个重要能力都源于基于海量数据的大模型预训练:在有3000亿单词的语料上预训练拥有1750亿参数的模型。海量数据为基础的大模型训练产生了突现能力(Emergent Ability),带来了AI研究范式的转变。只有在训练数据量足够大时,量变才能引起质变。GPT相比于此前模型所具备的“泛化能力”,就是以海量数据为基础产生的。

数据是AI的胜负手。

语言包含价值取向,未来想要不被强势文化压缩生存空间,中国必须发展自己的大模型。算法、算力和数据是AI发展的三大重要基础。展望未来,算法和算力都可以通过挖掘优质人才、引进优秀工程实践,或者直接购买海外优质资产追赶,而培养中文环境的优质数据集、语料库却必须长期自我积累沉淀,因此,该行认为未来数据将成为AI发展的胜负手,并有望为中国训练自己的大模型,走出差异化道路提供重要基础。

数据要素市场建设将提供高质量数据的基础。

发展自己的大模型需要以国内数据集为重要支撑,而国内目前缺乏高质量的数据集。国家数据要素市场建设将为国内提供高质量的差异化数据提供有力支撑。随着公共数据逐步开放运营,垂直行业数据由严监管向谋发展转变,数据要素市场化发展将使得算法厂商能够获得质量较高的公共和行业数据,提高训练质量和效率,进而为国内开发符合自身发展和价值观的大模型提供支撑。

投资建议:看好以下三个环节:1)数据运营:该行预计医保数据将有望成为公共数据放开的第一站,重点推荐久远银海(002777.SZ),建议关注山大地纬(688579.SH)、中科江南(301153.SZ)等。2)数据基础设施:有望成为最先放量兑现的环节。重点推荐深桑达A(000032.SZ),易华录(300212.SZ),云赛智联(600602.SH),建议关注中国电信(601728.SH)。3)数据安全:该行看好具备央国企背景和数据安全业务积累的相关厂商。推荐启明星辰(002439.SZ)、奇安信(688561.SH)、安恒信息(688023.SH)、电科网安(002268.SZ)等。

风险提示:政策推进不及预期;行业竞争加剧。

相关阅读

易华录(300212.SZ)发布2022年度业绩,扭亏为盈至1153.93万元

4月17日 | 林经楷

东吴证券:AI需求引领新一轮半导体周期起点 坚定看好投资窗口已至

4月17日 | 张计伟

东吴证券:四重逻辑共振 继续看好半导体设备投资机会

4月14日 | 张计伟

东吴证券:MLCC供给端出清 行业处于周期反转前夜

4月14日 | 严文才

山大地纬(688579.SH)发布2022年度业绩,净利润6191万元,同比下降39.95%,拟10派0.5元

4月13日 | 皮腾飞