2月25日,DeepSeek官宣,今日开源代码库为DeepEP,它是首个用于 MoE 模型训练和推理的开源EP通信库。
特点有:高效的全员沟通;节点内和节点间均支持 NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生 FP8 调度支持;灵活的GPU资源控制,实现计算-通信重叠。

来源:每日经济新闻
2月25日,DeepSeek官宣,今日开源代码库为DeepEP,它是首个用于 MoE 模型训练和推理的开源EP通信库。
特点有:高效的全员沟通;节点内和节点间均支持 NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生 FP8 调度支持;灵活的GPU资源控制,实现计算-通信重叠。
来源:每日经济新闻
网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5