智通财经APP获悉,中信证券发布研究报告称,大模型技术不断成熟,展现强大生成能力和通用性,模型规模提升和多模态能力增强带动基础设施需求。海外大模型技术保持高速推进,指引国产大模型发展方向,国内大模型行业发展有望逐步加速。未来大模型多模态能力不断展现,有望带来广阔市场机遇,推动AI商业化进程加速和市场天花板打开。持续看好大模型千行百业的落地机遇,建议关注大模型在办公、企业管理、教育、图像视频等领域的应用机会,建议持续关注相关领域的头部AI公司。
▍中信证券主要观点如下:
大模型概述:具备强大生成能力,训练趋于标准化。
通用大模型追求高泛化能力,可以高质量完成自然语言理解和生成任务。大模型训练流程趋于标准化,大致可分为通用能力培养和行业能力提升两大阶段,其中通用能力培养阶段主要包括无监督预训练、价值观对齐等核心步骤,行业能力提升阶段主要包括监督微调、行业数据预训练、模型偏好对齐等步骤。当前海外通用大模型主要有OpenAI的GPT-4、谷歌的Gemini、Anthropic的Claude 2、Meta的Llama 2等。
大模型技术:形成三大技术路线,GPT路线得到认可。
Transformer引入自注意力机制,彻底解决了远距离信息丢失和并行计算效率的问题。基于底层Transformer,模型形成编码器、解码器、编码器-解码器三大主流技术路线,OpenAI的GPT模型采用解码器路线,得到广泛关注和认可,最新的GPT-4模型在环境科学、历史、生物等高文本量的学科中取得前10%的成绩,引领行业发展。但当前大模型和通用人工智能在通用性、认知能力、工具能力、多模态协同等方面仍有较大差距,技术具备较大发展潜力。
多模态:视觉能力为核心,能力升级带动应用落地。
多模态主要包括视觉和语音,其中视觉能力对模型感知能力和应用开发潜力提升具有重要价值,成为当前多模态大模型发展的核心方向。多模态能力打开模型学习空间,突破文本对模型训练的限制,在高质量文本数据规模年化增速不及5%的情况下,保障模型规模高速增长。
语音能力方面,大模型可以利用STT+TTS+GPT模式快速实现语音对话,整体技术成熟度较高,门槛相对较低。
视觉能力方面,视觉理解领域主要形成模块化和一体化两大路线,其中模块化设计灵活度更高并具备更高性价比,而一体化(原生)架构下模型多模态融合能力更突出。视觉生成领域,主要利用扩散模型实现图片和视频生成,底层技术来看,图像和视频生成技术具有一致性。大模型视觉理解和生成能力提升,有望重塑部分行业,带动全新应用落地。
其他模态上,代码大模型快速发展,国内外厂商加速布局,国内厂商位于行业第一梯队。
短期来看,海外高质量源生多模态大模型技术和商业化进程高速推进,国产多模态大模型有望加速追赶,推动行业保持高速发展。
行业落地:大模型赋能千行百业,应用市场蓬勃发展。
根据前瞻产业研究院数据,我国AI市场规模有望在中短期保持高速成长,2025年有望超过2000亿。未来大模型有望以“订阅+流量”和“项目+服务”等模式落地行业,看好大模型在千行百业的落地机遇。
1)办公:应用落地的核心场景,打造智能办公助理。考虑到AI+办公应用场景扎实、效率提升明确、功能演进清晰、商业落地加速,办公软件成大模型应用落地的核心场景之一。
2)教育:全面引领教学变革,海外产品落地获得认可。分别面对教师和学生,形成“教、管、学、考”四大场景。行业应用场景丰富,拥有成熟商业化道路,有望加速实现行业大模型落地。
3)企业管理:助力企业降本增效,国内龙头产品逐步落地。大模型融入ERP实现降本增效,如:①企业经营管理,如企业财务分析、人才管理等,提升企业整体经营效率。②个人工作助手,包括智能表单生成、代码开发助手、一键OA生成等功能,辅助员工提升工作效率。
4)消费娱乐:新场景层出不穷,数字营销与游戏行业有望快速落地。5月Google Marketing Live上,谷歌展示了最新的广告推送方案和Product Studio产品,验证大模型在个性化推送和广告素材生成上的潜力。游戏领域,育碧、虚幻引擎、网易等国内外知名厂商均推出相关产品,加速探索模型应用。
风险因素:
AI核心技术发展不及预期风险,企业数据安全风险,信息安全风险,行业竞争加剧风险,地缘政治风险,监管政策风险。