DeepSeek宣布开源DeepGEMM

226 2月26日
share-image.png
陈雯芳

智通财经APP获悉,Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如DeepSeek-V3中所提出。它支持普通和混合专家(MoE)分组的GEMM。该库采用CUDA编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。

DeepSeek开源周第二日(2月25日),DeepSeek官宣开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。特点有:高效、优化的全员沟通;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。

2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。2月21日,DeepSeek在社交平台发文称,构建了一支探索AGI(通用人工智能)的小团队,将开源5个代码库,以完全透明的方式分享研究进展。

相关阅读

全球AI大混战升温!超越Sora的阿里万相大模型开源 家用显卡都能跑

2月26日 | 智通转载

富达国际:中国股市本轮上涨与以往不同 AI发展或是最重要因素

2月25日 | 陈雯芳

DeepSeek开源周第二日:开源EP通信库

2月25日 | 陈雯芳

DeepSeek启动开源周 首个开源的代码库为Flash MLA

2月24日 | 陈雯芳

东吴证券:Figure发布VLA大模型Helix 大规模减少训练数据需求

2月21日 | 陈宇锋