DeepSeek开源周第二日:开源EP通信库
DeepSeek官宣,今日开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。特点有:高效、优化的全员沟通;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。DeepEP是一款专为混合专家(MoE)和专家并行(EP)设计的通信库,提供了高吞吐量和低延迟的all-to-all GPU内核,常用于MoE派发和合并操作。该库还支持低精度计算,包括FP8。
—— DeepSeek
发表回复