7B - 搜索 News

4 小时

原作者带队再次改造xLSTM，7B模型速度最快超Mamba 50%，权重代码全开源

具体来讲，xLSTM 7B 模型基于 DCLM 数据集，使用 128 块 H100 GPU，在 8192 上下文长度下训练了 2.3 万亿 token。研究者对原始 xLSTM 架构进行了改进，确保训练效率和稳定性，同时保持任务性能。新架构依靠 ...

12 天

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

随着 DeepSeek-R1 的流行与 AI4Math 研究的深入，大模型在辅助形式化证明写作方面的需求日益增长。作为数学推理最直接的应用场景，形式化推理与验证（formal reasoning and verification） ...

腾讯网3 天

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

1. 小米大模型团队受DeepSeek-R1算法启发，对阿里Qwen2-Audio-7B模型进行微调，使MMAU榜单准确率从49.2%提升至64.5%。

3 天

小米7B模型崛起：音频理解准确率飙升至64.5%，超越GPT-4o

在人工智能领域，尤其是音频理解和推断的技术上，小米的大模型团队近期取得了令人瞩目的成果。他们通过迁移DeepSeek-R1算法，对阿里巴巴的Qwen2-Audio-7B模型进行微调，使其在音频理解评测基准MMAU榜单上达到了64.5%的准确率。这一成绩不仅超越了之前的领先者GPT-4o，也为整个音频AI行业带来了新的研究方向与可能性。

腾讯网4 天

从零复现，全面开源：360 Light-R1-14B/7B带来端侧AI平权时刻

性能领先、开源普惠、国产易获取的三重势能，造就了年初DeepSeek的技术平权狂热，掀起AI普惠浪潮。

9 天

使用DeepSeek的GRPO，7B模型只需强化学习就能拿下数独

近日，技术博主 Hrishbh Dalal 的实践表明，这个问题的答案是肯定的。并且他在这个过程中用到了 DeepSeek 开发的 GRPO 算法，最终他「成功在一个小型数独数据集上实现了高奖励和解答」。

3 天

小米7B音频理解模型登顶MMAU榜单，AI技术迎来新突破

在智能设备行业的科研创新中，小米一直走在前列。最近，小米大模型团队成功将DeepSeek-R1同款算法应用于Qwen2-Audio-7B模型，使其在音频理解和推断的漏斗中脱颖而出，成为MMAU（Massive Multi-Task Audio Understanding and ...

16 天on MSN

微软拥抱 DeepSeek，Copilot+ PC 本地运行 7B 和 14B 模型

IT之家 3 月 4 日消息，微软今日宣布，通过 Azure AI Foundry 接入 DeepSeek-R1 7B 和 14B 蒸馏模型，为 Copilot+ PC 提供本地运行 7B 和 14B 模型的能力。早在今年 1 月，微软就宣布计划将 DeepSeek-R1 模型的 NPU 优化版本直接带到搭载高通骁龙 X 处理器的 Copilot+ PC ...

来自MSN15 天

微软助力深度学习：Copilot+PC本地运行7B和14B模型，DeepSeek引领新潮流

微软助力深度学习，接入DeepSeek-R1 7B和14B蒸馏模型，为Copilot+ PC提供本地运行能力，引领深度学习新潮流。该量化方法提升了模型运行效率，为PC用户提供了更多选择。微软在深度学习领域的技术实力得到展现。

快科技23 天

兆芯全系整机成功部署DeepSeek-R1：双路64核跑满血671B

KX-7000台式机本地部署DeepSeek-R1-7B模型基于开先KX-7000桌面处理器的台式机，通过搭配国内显卡、加速卡，在本地成功部署DeepSeek-R1-7B模型，可充分发挥 ...

来自MSN1 个月

青云科技基石智算正式上线DeepSeek Janus-Pro-7B，AI算力云再添新成员！

青云科技近期宣布，其旗下的AI算力云服务基石智算CoresHub正式推出了DeepSeek Janus-Pro-7B WebUI版文生图模型。这一创新服务融合了Multimodal Understanding（多 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果