12 天
知乎 on MSNDeepSeek 开源周第三天推出 DeepGEMM,有哪些亮点值得关注?应用前景 ...这次放出的技术细节和实现思路有不少值得关注的亮点,尤其是在FP8计算和Hopper架构适配这两个关键方向上,体现出不少工程层面的巧思。 1. 精准定位FP8计算痛点 FP8作为下一代AI计算的关键数据类型,最大的挑战在于精度损失与硬件适配。DeepGEMM没有直接沿用CUTLASS的复杂模板,而是针对FP8累加误差问题设计了「CUDA-core两级累加」机制。这种在张量核心计算后引入CUDA核心做 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果