中信建投:国内大模型应用元年已至

115 3月28日
share-image.png
张计伟

智通财经APP获悉,中信建投发布研究报告称,当前国内大模型能力逐步提升,中文领域处理和部分特性如长文本处理等有对齐和领先优势。随着Kimi热度提升,国内多家大模型厂商加入长文本能力竞争,产业C端落地加速。该行认为模型迭代和推理需求提升,促进底层算力基础设施需求释放,利好算力产业链,此外,模型参数量起来,对于高质量的数据需求增加,数据丰富对模型效果有较大影响。

中信建投观点如下:

国内大模型能力持续迭代,表观参数逐步接近海外大模型。

自2022年底ChatGPT横空出世,为大家展示了AGI的巨大可能性后,国内厂商纷纷跟进推出自己的大模型产品,国内一度呈现“百模大战”的投资和研发热潮。在高端GPU获取受限后国内大模型陷入了一段时间的瓶颈期。当前国内大模型竞争逐步向头部互联网厂商集中,这些厂商具备较强的研发能力,并且能够承担较高的早期投入,紧跟大模型发展浪潮,带动自身大模型能力持续提升。具体来看,国内大模型综合表现较海外模型落后,由于训练数据源的差异和特性方向的训练,例如数据源中具有更多的中文数据,在中文处理能力的在理解和生成方面较海外模型表现更好。此外,AI创业公司的大模型值得期待,例如23年10月发布并于近期爆火的Kimi,凭借200w长文本能力在金融领域掀起访问热潮;3月23日阶跃星辰发布Step-2万亿参数MoE语言大模型预览版,从参数端对标GPT-4水平,可以看到国内大模型进入一个新纪元。

AIGC经历去年普及后,活跃用户数持增加,Kimi访问火爆导致阶段性宕机。

去年来,随着AIGC带来的新产业热潮,国内各头部厂商开发了办公、设计、游戏娱乐、电商等多个领域的相关应用。国内用户对于这些应用也产生了较大热情,根据Quest Mobile数据,截至2024年1月,国内前十大AIGC APP活跃用户加总去重人数超5000万人,同比增长超37倍。近期爆火的Kimi日度访问人数持续提升,导致算力资源紧张,较多用户在使用中出现宕机情况。Kimi所属公司月之暗面发布公告表示:自3月20日以来观测到Kimi系统流量持续异常增高,公司已进行5次扩容,后续还将配合流量进行扩容以尽量承载持续增长的用户量。

Kimi“鲶鱼效应”,带动多家大模型厂商宣布开放长文本能力,产业端落地加速。

自Kimi宣布内测200w长文本能力以来,国内头部大模型厂商迅速跟进,百度文心一言将于下个月升级,提供200-500万字长文本能力,相较当前2.8万字显著提升;阿里则表示将向全部用户免费开放1000万字长文档处理功能。除长文本能力外,近日阶跃星辰公布的2万亿参数MoE大模型则从参数量角度对标GPT-4。Kimi的爆火有望带动国内大模型+应用新一轮加速发展,持续推动模型能力迭代和应用月活提升。

总结:当前国内大模型能力逐步提升,中文领域处理和部分特性如长文本处理等有对齐和领先优势。AIGC产业蓬勃发展,AIGC应用月活人数持续增长,2月活跃人数同比增长超37倍,突破5000多万人次。Kimi近期访问量快速增长导致出现间断性宕机,公司已进行多次扩容仍无法满足算力需求。随着Kimi热度提升,国内多家大模型厂商加入长文本能力竞争,产业C端落地加速。

同时,一方面,模型迭代和推理需求提升,促进底层算力基础设施需求释放,利好算力产业链;另一方面,模型参数量起来,对于高质量的数据需求增加,数据丰富对模型效果有较大影响。建议关注:1)AI应用:重点关注涉及长文本处理,如法律文本、合同文本、知识库学习、阅读、客服等需要文本知识输出的场景的应用;2)算力产业链,预期随着AI产业的发展,算力短期仍将处于需求大于供给的状态;3)数据产业链,高质量合规数据的提供商有望持续受益模型迭代。

相关阅读

加拿大AI初创公司Cohere新一轮融资进入后期谈判阶段 有望冲击50亿美元估值

3月28日 | 庄礼佳

关系6G、人工智能等 最新行动计划!18部门联合印发

3月27日 | 智通编选

Adobe(ADBE.US)携手微软(MSFT.US)探索生成式AI应用 助力营销人员“解放双手”

3月27日 | 汪晓理

香港创新科技及工业局:预计数码港人工智能超算中心首阶段设施最早下半年启用

3月27日 | 陈雯芳

AI引发失业潮?研究显示:AI将使英国失去800万个工作岗位

3月27日 | 魏昊铭