智通财经APP获悉,中金公司发布研究报告称,近期,市场对于ChatGPT的关注度持续高企,数据和人工智能是相辅相成的。人工智能的迭代需要数据作为基石,数据的价值需要人工智能的充分挖掘。数据库、分布式计算等技术在AI的不同阶段提供关键支撑。建议投资者持续关注AI风口下数据产业链相关公司的投资机会。
▍中金公司主要观点如下:
数据是AI的“血液”,数据要素市场发展有望丰富语料供给。
语料数据是人工智能模型训练的前提和基础,AI公司获取语料数据一般有开源数据库、自有/自建数据、购买数据产品授权这三种方式。
该行认为,数据要素市场的全面激活,一方面将直接丰富企业能够购买到的数据授权产品;另一方面,有望长期推动企业数据存储分析等基础平台的建设,有助于企业内部数据留存,对后续特定领域行业小模型训练至关重要。
基础设施视角:数据的存储与计算技术夯实AI软实力。
数据存储、计算技术在AI不同阶段均提供关键支撑。数据存储是前提,AI需要大量数据,长期看有助于推动企业数据文化建立,OLTP、OLAP数据库均有望持续受益。分布式计算框架支撑模型开发,Data+AI呈现平台化融合趋势。
市场上有两类参与者,一类是以Ray为代表的原生为AI、ML设计的分布式计算框架,提供开放接口与数据管理平台集成;另一类是领先的大数据厂商如Databricks、星环科技,将分布式计算能力从大数据处理向AI层自然延伸,推出数据智能底座产品,根据计算有望带来年均60亿元的增量市场。
从模型到生产应用:MLOps助力AI模型落地生花。
AI大规模生产中存在由于流程、管理不当造成的效率低、周期长等问题影响实际落地,MLOps是为解决上述问题、通过统一ML研发和运营过程实现提质增效的一套工程管理方法论和工具链,赋能AI模型全生命周期的各个流程。
目前MLOps厂商主要分为专项工具和平台型产品两类,海外MLOps生态庞杂,细分赛道参与者众多,国内以平台型厂商为主。
风险
技术进展不及预期,商业化落地节奏不及预期,行业竞争加剧。