DeepSeek宣布开源了针对Hopper GPU进行优化的高效型MLA解码核——FlashMLA,并在GitHub上已经获得了超过5000Star收藏和188个Fork。业内专家认为,对于国产GPU而言,这是一个重大利好,可以通过FlashMLA提供的优化思路和方法论大幅提升性能。FlashMLA在英伟达H800 SXM5 GPU上表现出色,能够实现3000 GB/s的内存速度和580TFLOP ...
在过去的三个月中,Firefox 在发布nightly Linux 版本时启用了 ForkServer,以改善多进程浏览器体验。 结果看起来不错,针对 Linux 的 Firefox 正式版本也将很快开始发布 ForkServer,以获得性能上的提升。Mozilla 工程师 Alexandre Lissy 在本月早些时候举行的 FOSDEM 2025 大会上介绍了 Mozilla 在 Firefo ...