GPU SM - 搜索 News

现代 GPU 是基于细分级别的层次结构构建的，因此它们可以扩展以达到不同的性能、功耗和价格目标。在英特尔 GPU 上运行的着色器程序可以通过读取（状态寄存器 0）架构寄存器的低位来检查其运行的位置sr0。

10 小时

2006年，英伟达推出了Tesla架构的第一代（G80），开启了GPU通用计算探索。Tesla架构之前的显卡也经历了几代的发展，但基本上是图形显卡。而它采用全新的CUDA架构，支持使用C语言进行GPU编程，可以用于通用数据并行计算。这成为英伟达改变自 ...

新浪网25 天

DeepSeek开源第二弹：EP通信库来了，有望再次降低计算消耗

“DeepSeek提出一种流水线并行算法DualPipe，通过精细控制分配给计算和通信的GPU SM数量，实现计算和通信完全重叠，从而提高GPU资源的利用率 ...

新浪网25 天

DeepSeek开源第三弹！极致榨干GPU，FP8训推秘籍公开

DeepSeek分享了清晰的上手指南，需要Hopper架构GPU、必须支持sm_90a，要求是Python 3.8、CUDA 12.3、PyTorch 2.1、CUTLASS 3.6或更新版本。DeepSeek强烈推荐CUDA 12.8或 ...

腾讯网1 个月

GPU是如何进行算力管理的？

MIG可以分割可用的GPU计算资源（包括流式多处理器或SM和GPU引擎，如复制引擎或解码器），以提供定义的服务质量（QoS），并为不同的客户端（如 ...

36氪25 天

榨干每一块 GPU，DeepSeek 开源第二天，送上降本增效神器

而在大模型里，这就是不让计算资源浪费。DeepEP 能根据任务量动态调节 GPU 的计算资源（SM 数量控制）。任务多的时候，就让 GPU 里更多计算单元一 ...

证券时报官方网站25 天

DeepSeek开源第二弹：EP通信库来了，有望再次降低计算消耗

DeepSeek在代码托管网站GitHub上解释，对于延迟敏感的推理解码任务，DeepEP包含有一组使用纯RDMA的低延迟内核，可以用于将延迟最小化，DeepEP还引入一种通信与计算重叠的方法，这种方法可以不占用SM（流处理器）资源。简而言之，DeepEP也是用于提升GPU利用效率的 ...

搜狐1 个月

震撼发布：英伟达Blackwell GPU架构揭晓GeForce RTX 50系列新技术

虽说这种设计在新一代Ada GPU上得以延续，但Blackwell架构标志着一种新的合一时代：每个SM单元便能够在INT32和FP32之间切换，意味着其整数运算能力 ...

5 天

三星XCover 8 Pro性能参数泄露，Adreno 810 GPU加持即将发布？

近日，三星Galaxy XCover系列的新成员——Galaxy XCover 8 Pro的性能参数泄露，引发了广泛关注。据可靠外媒报道，其开发工作已经圆满结束，目前正处于认证与基准测试的关键阶段。这款备受期待的设备已经在TV ...

5 天

三星Galaxy XCover 8 Pro性能亮相：Adreno 810 GPU助力即将发布！

更令人兴奋的是，Geekbench的数据表明，Galaxy XCover 8 Pro搭载了Adreno 810 GPU，依旧延续高通骁龙7s Gen 3处理器。这个组合保证了强大的性能，Galaxy XCover 8 Pro的单核得分达到了1157，多核得分为3288。与其前代产品Galaxy XCover 6 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果