打开APP
国泰君安:Deepseek链式反应颠覆产业生态 看好国产推理算力爆发
蒋远华 02-17
阅读量

智通财经APP获悉,国泰君安证券发布研报称,Deepseek通过算法优化降低模型训练与推理成本,开创了全新的大模型研发范式,极大地降低了对硬件算力的需求,这些创新突破共同构建了对"算力军备竞赛"发展路径的系统性颠覆。预计云服务厂商将迎来一波新的增长势头,短期来看现阶段本地部署可能是最适合大型企业和特殊行业企业的AI调用方式。该行看好本地国产推理算力的爆发,以及如向量数据库等新型基础软件的扩圈。

国泰君安证券主要观点如下:

Deepseek以“单位算力效能提升10倍”为目标,通过算法优化降低模型训练与推理成本。Deepseek打破了AI大模型领域“拼投入” 的固有观念,以极低的成本实现了与行业巨头相媲美的模型性能。在训练成本方面,训练671B的DeepSeek V3的成本是557.6万美元(约合4070万人民币),仅为Llama 3的7%,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,还需要上万张英伟达H100芯片,相比之下DeepSeek-V3在训练时使用的GPU是英伟达的H800,一款在性能上被削弱的特供AI芯片。如今DeepSeek-R1用不到GPT 5%的成本,便获得了和OpenAI的顶尖推理模型o1相当的能力。同时公司采用MIT协议全栈开源,包括模型权重、训练代码及部署工具链,吸引全球开发者共建生态。

DeepSeek的技术革命性在于其开创了全新的大模型研发范式。首先DeepSeek采用了MoE和MLA两大创新架构来实现高效的推理和成本效益高的训练;算法层面,动态稀疏化专家网络设计(Dynamic MoE),使模型推理过程中仅需调用不足4%的神经网络参数;工程层面,Deepseek采用FP8低精度训练框架,相比传统32位计算方案,能耗降幅高达80%的同时保持模型收敛稳定性;尤为突破的是DeepSeek R1引入的强化学习驱动范式摆脱了对SFT的依赖,通过自演进式训练机制,其基于强化学习的冷启动策略仅需行业基准值1/5的标注数据量即可完成高效训练。这些创新突破共同构建了对"算力军备竞赛"发展路径的系统性颠覆。

开源模型DeepSeek在当下的AI时代将扮演重要角色,就像Android之于移动互联网革命。它会重构产业生态,引发链式反应,加速上层应用发展与下层系统统一。这将调动起跨越软硬件和上下游的生态力量,促使各方加大“模型-芯片-系统”协同优化与垂直打通的投入,进一步削弱CUDA生态优势,为国产AI产业发展创造机遇。DeepSeek通过技术创新,在AI模型训练过程中实现了对高端进口芯片依赖的降低,这为国内企业展示了一条可行的技术路径,极大地增强了国内企业自主研发算力芯片的信心。

风险提示:技术研发进展不及预期、资本投入不及预期、市场竞争加剧的风险。

更多精彩港美股资讯
相关阅读
点击下载