DeepSeek宣布开源DeepGEMM 支持FP8高效矩阵乘法

财联社 2025-02-26 11:42:20
A+ A-

DeepSeek宣布在开源周第三天开源了DeepGEMM。这是一个专为简洁高效的FP8通用矩阵乘法(GEMM)设计的库,具备细粒度缩放功能。DeepGEMM支持普通和混合专家(MoE)分组的GEMM,采用CUDA编写,在安装过程中无需编译,而是通过轻量级的即时编译(JIT)模块在运行时编译所有内核。该库为V3/R1训练和推理提供了支持。

责任编辑:张小花 TT1000

热点新闻

精彩推荐

加载更多……