智通财经APP获悉,鹏格斯资产管理公司发布报告称,整体通用生成式人工智能将会衍生更多云计算 (公有云) 需求,无论从 (供应端)应用开发人员效率提高及对 (需求端) AI应用开发需求提高。所以估计能够更快结束行业从2022年开始增速放缓期。这次为行业的基本面改善,所以整个公有云更多将会是整个行业的机会。所以鹏格斯认为选股也可以从相对股值的角度考虑。值得注意,生成人工智能对于云计算收入增量不会出现一次性巨量状况,更多是续步改善步伐。
同时,对于SaaS行业后台应用,通用人工智能的机会更多于向量搜索以及向量数据库。大部份主要将非上市公司,有部份公司 (例如: snowflake(SNOW.US)通过收购) 向 向量搜索发展。相信将能够为现有业务带来额外引流。同时数据处理量多元化及 实时性也会对于个别数据库 (NoSqL- MongoDB) 以及 数据连接器 (Confluent(CFLT.US) — Kafka) 的需求将来拉动。由于个别股份的涨幅较多 (例如: MongoDB(MDB.US)),所以应该同时注意投资的风险进行考虑。
公有云行业从2022年开始增长放缓,AI相信有望重燃行业增长
报告指出,云计算行业经过2020/2021年疫情在家工作的推动后,2022年/2023上半年行业整体进入了调整期。云计算行业龙头AWS也从2021年每个季度按年增长约>30% 大幅放缓到最近季度约按年10%增长。随着 1). 人工智能应用(例如: 联天机器人chatbot) 以及 2). 通用人工智能赋能更快的应用开发效率 (例如: 根据compass UOL study,使用通用人工智能(generative AI)能够提升软件工程师的效率从56小时缩短到36小时。同样完成一样的工序的情况,从这两个推动因素下市场开始对于云计算增长放缓的看法有所改观。
以传统公开云行业占比来说,亚马逊AWS 于 a). 科技/金融行业客户 占比普遍高于其他同行。所以受到科技行业减成本景气的情况。而微软azure 客户行业范围较为阔广涉及到不同传统行业。从公开云增长恢复的观点来看Azure较优。但由于通用人工智能对(供应端)应用开发人员效率以及 对 (需求端) AI 应用开发需求都有所提升,鹏格斯相信云计算行业将会是整个行业基本面改善。所以于公有云个股选择上除了考虑个股基本面外,应同时考虑估值的相对差距进行操作。
截图来源﹕Business Insider
Generative AI 生成式对于带动SaaS 行业增长提速
Vector search 向量搜索配合 vector database 向量数据库为生成式通用智能主要支撑工具
报告认为,向量搜索为提供生成式AI 服务的其中核心工具,当中包括涉及到相似度搜索的能力 (使用k-最近搜查来搜索最近的量) 而为输入的问题 (prompt query) 提供更为准确的答案。而不同生成式搜索工具之间的性能差别将会影响到AI的准确性,所以于vector search 的选择上以质量考虑为优先。但由于vector search 主要头部玩家属于大型上市公司 (例如: facebookresearch) / 私有企业 (例如: milvus),所以比较难找到单独的上市个股。
Snowflake 最近Neeva 收购以提供vector search向量搜索能力,能为现有业务带来协同效应
报告认为,Snowflake主要提供relational database数据库以及数据分析功能,目前主要以relational database 关系数据库作为支撑。Snowflake公司最近也公布收购Neeva 将会提供生成式AI所需的向量搜索能力。虽然目前snowflake 没有提及到太多的相关整合 (预期将会于6月27号分析师日) 提及到相关应用。鹏格斯暂时估计Neeva整合后将会能够赋能Snowflake为其他客户企业内部数据进行联天式机器人chatbot style 应用,成为公司未来引流新客户或者加大现有客户数据于snowflake的存放量。
但比较需要留意的是snowflake现时行业收入占比中 约20% 为金融行业以及部份创投VC企业,所以短期受到这些行业的(因为银行信贷危机影响) 不景气对使用量 (consumption pattern) 影响较大。虽然Neeva 收购暂时同贡献不大,但值得留意未来当snowflake neeva为企业客户提供生成式AI chatbot企业搜索功能时,可能会吸引更多企业将数据存于snowflake。Neeva过去为一家提供AI生成式搜索网站,所以市场比于neeva的向量搜索准确度都比较确定。
图表2: 向量资料搜索过程图
截图来源﹕Elastic Search
图表3: 向量数据搜索排名
截图来源﹕Ossinsight.io
Generative AI 大模型应用将会加快数据流通,利好整体后台SaaS应用
报告表示,大模型generative AI应用除了需要使用向量数据库支撑用户搜索外,同时也需要传统的数据库进行额外数据存储。由于generative AI 数据库量可能达到约千亿线级parameters 参数水平,而且可能涉及到图像及文字之间不同格式的组合。所以noSQL 的数据库可能提供更方便/灵活的存储格式,因为比较不受到传统SQL database表格数据单元格式限制。同时,企业应用更多实时性使用prompt 问答应用,也会对NoSQl类型的数据库使用量需求预计将会利好。
于生成式AI chatbot 应用增加用户与应用之间互动,赋能更多个性化服务以及数据库数据储存
报告表示,于用户与应用之间互动加大的趋势下,鹏格斯相信会对noSQL类型的数据库需求 (例如: MongoDB文件document-based 数据库) 特别利好。但需要注意MongoDB 最近股价走势已经涨了不少的风险。由于生成式AI 于客户交流的时候,涉及到更多个人化的信息交换。non-relational 数据库能够更便捷地储存用户相关信息。
比较有实时性需求AI chatbot应用亦会趋向使用NoSQL数据库,带动mongoDB数据库需求。根据6sense.com数据,MongoDB 2022年于NoSQL数据库中市占率达到45.19% 。MongoDB NoSQL数据库也比较适合于处理非结构化数据。但值得留意Generative AI人工智能的应用利好将会是续步性,而不是一次性带来巨量增长。所以值得同时留意股价的风险。
图表4﹕ MongoDB使用例子
截图来源﹕https://hevodata.com/learn/mongodb-use-case/
大模型应用同时也衍生更多数据库之间的实时连接
报告指出,需求大模型 (特别是针对个别企业定制的模型) 需要针对公司内部不同系统数据库先进行整合,整合过程中将对于数据库连接器软件的需求增加。Confluent就是一家专门处理资料连接的企业,近期也提到人工智能应用包括: chatbot 联天机器人的互动涉及到实时数据传输,而且当中可能涉及到多用户同时进行的运输量。Confluent kafka 就是主要为管理客户数据库之间的连接,普遍大家认为Confluent cloud能够提供更加稳定性强的连接。
对于chatbot联天机器人等的前台应用,连接稳定性及实时性将直接影响到客户体验。随着NoSQL数据库使用场景受惠于Generative AI 应用,将会带来更多的数据库连接器需求。虽然连接器也有部份企业使用内部研发,但kafka能够普遍认为能够提供更好的经济效益。
图表5﹕ Confluent (Kafka) 于NATS市场占有率为41.21%
截图来源﹕https://hevodata.com/learn/mongodb-use-case/