太平洋证券:重视AI多模态带来的商业化价值 推荐关注三条主线

179 12月11日
share-image.png
张计伟

智通财经APP获悉,太平洋证券发布研究报告称,谷歌Gemini1.0发布标志着多模态领域取得里程碑式进展,产业趋势确定性进一步明确。在商业化方面,过往由于AI应用主要集中于B端,商业化发展受到限制。随着多模态新产品和新技术的持续迭代,Pika在多模态领域取得突破,AIGC有望在文娱行业拓展应用,进一步打开C端市场,提升商业化价值。今年是AI应用落地的元年,建议重视场景和用户的价值。

太平洋证券观点如下:

谷歌Gemini1.0发布,测试表现远超现有多模态大模型

12月6日,谷歌原生多模态大模型Gemini1.0版正式上线,针对不同任务,其分为GeminiUltra,GeminiPro和GeminiNano。该模型具有复杂多模态推理能力,可以帮助理解复杂的书面和视觉信息,还可以同时识别和理解文本、图像、音频等内容。在编码方面,其具备擅长解决超越编码的复杂数学和理论计算机科学的竞争性编程问题的代码生成系统AlphaCode2。不同于为不同模态训练独立组件后拼接的多模态模型创建方法,Gemini1.0先在不同模态上进行预训练,再用额外的多模态数据进行微调,以进一步提高其效果,这使得Gemini可以从零开始无缝理解和推理不同类型的信息,表现远超现有的多模态模型。具体来看,GeminiUltra在MMLU(大规模多任务语言理解)测试中,以90.0%的高分首次超过人类专家;在包括跨领域多模态任务的MMMU(大规模多学科多模态理解)基准测试中,GeminiUltra取得了59.4%的高分,高于GPT-4V的56.8%。我们认为,Gemini1.0是AI技术在多模态领域取得里程碑式进展的重要标志,其将为相关AI应用发展提供有力支持,促进应用产品丰富和应用场景拓展。

Pika1.0测评结果表现突出,进一步打开C端市场

2023年11月29日,美国AI初创公司PikaLabs发布其视频生成模型Pika1.0,该模型具备使用文本生成和编辑多种风格视频的功能。根据数字生命卡兹克的测评:1)在使用方面,Pika1.0相较于此前在Discord社区的公测版更易用。视频比例和帧率、镜头控制和速度、负面提示词及提示词相关性都由原来的手动输入改进为了页面点击设置,并且视频扩展、区域修改、放大增强和视频延长4秒的功能在生成视频后的二次编辑窗口可直接点击使用。2)在生成视频的效果方面,Pika1.0模型的语义理解能力强,文生视频和图生视频的质量大幅提升,模型尤其擅长3D和3D动画风格。3)此外,视频扩展、区域修改、视频延长4秒、一键增强功能也表现突出。我们认为,Pika1.0模型各项功能的突出表现将吸引更多的视频创作者了解并使用多模态大模型辅助创作,进一步打开C端用户市场,扩大AI大模型的商业化空间。

AI+视频新产品和新技术持续更新迭代,商业化价值有望提升

回顾近期受到市场关注的AI+视频产品的进展:1)2022年7月,诗云科技推出具备声音克隆、AI数字人生成等功能的在线视频生成平台HeyGen。2)2023年11月3日,Runaway对视频生成模型Gen-2进行更新,提高生成视频的清晰度和一致性;11月20日上线运动笔刷功能,实现视频局部区域的由静转动。3)11月16日,Meta发布基于扩散模型的文本/图像到视频的视频生成应用EmuVideo。4)11月18日,字节跳动发布高动态视频生成模型PixelDance。5)11月21日,StabilityAI推出由文本/图像到视频的StableVideoDiffusion(SVD)开源视频生成模型。6)11月28日,PikaLabs发布具备使用文本生成和编辑多种风格视频功能的视频生成模型Pika1.0。12月8日,PikaResearch首次对外披露的技术细节显示,基于DreamPropeller方法,文本到3D的生成速度可提升4.7倍。我们认为,AI+视频领域正方兴未艾,新产品推出和技术迭代将持续推动该领域的发展。并且,过往由于AI应用主要集中于B端,商业化发展受到限制。随着多模态技术取得突破,C端用户需求得到满足,AI多模态有望进一步打开C端市场,提升商业化价值。

推荐关注三条主线:

1)大模型和AIAgents:昆仑万维(300418.SZ);

2)多模态:文字IP:中文在线(300364.SZ)、掌阅科技(603533.SH);形象IP:上海电影(601595.SH),奥飞娱乐(002292.SZ);多模态赋能视频:华策影视(300133.SZ),光线传媒(300251.SZ);

3)AI应用:AI社交产品:盛天网络(300494.SZ);AI教育:皖新传媒(601801.SH),佳发教育(300559.SZ);AI校对:果麦文化(301052.SZ);AI游戏:恺英网络(002517.SZ)、三七互娱(002555.SZ)、吉比特(603444.SH)、巨人网络(002558.SZ)、电魂网络(603258.SH)、掌趣科技(300315.SZ)。

风险提示:AI技术发展不及预期风险;政策监管风险;行业竞争加剧风险。

相关阅读

掌阅科技(603533.SH)股东量子跃动拟减持不超1%股份

12月5日 | 皮腾飞

华泰证券:AI视频应用Pika出圈 AI应用正进入爆发前夜

12月4日 | 张计伟

信达证券:微短剧行业“支持性监管”政策频出 产业链有望迎长期稳健发展

11月27日 | 张计伟

光大证券:短剧监管常态化 利好头部内容厂商以及短剧出海

11月23日 | 张计伟

昆仑万维(300418.SZ)拟将北京绿钒股权及债权转让予实控人周亚辉

11月21日 | 林经楷