R1 - 搜索 News

腾讯网7 小时

17款大模型PK八款棋牌游戏，o3-mini胜出，DeepSeek R1输在中间步骤

在论文发布的版本里，作者评测了包括 GPT-4o，Claude-35-Sonnet, Gemini-1.5-pro-preview 等17个当时最领先的 LLM，每两个模型在每个游戏上进行20轮相互对抗赛（10 轮先手 10 ...

11 小时

17款大模型PK八款棋牌游戏，o3-mini胜出，DeepSeek R1输中间步骤

1 小时

AI大模型激战棋牌，o3-mini登顶DeepSeek R1败北

在人工智能（AI）的世界里，一场没有硝烟的战争正在悄然上演。近期，来自港大、剑桥和北大的研究人员联合发布了一项名为GameBoT的评测基准，这场较量汇聚了17款顶尖的大规模语言模型，在八种经典的棋牌游戏上一决高下。在这场智力与策略并重的比拼中，OpenAI推出的o3-mini模型以出色的表现脱颖而出，而另一款备受瞩目的国产AI——DeepSeek R1则略显逊色，尤其是在游戏推理的中间步骤上。

知乎专栏 on MSN1 天

上财开源首个金融领域R1类推理大模型，7B模型媲美DeepSeek-R1 671B满血 ...

该项目由上海财经大学统计与数据科学学院张立文教授与上海财经大学统计与数据科学学院博士生郭鑫、硕士生刘赵伟和课题组核心成员蔡维格、牛晋怡、曾凌峰、娄方齐、王子璇、胥佳杰、赵学前、杨子纬，以及财跃星辰白祚博士和团队成员陈德智、许晟、李超共同完成。

2 天

用英特尔酷睿 Ultra及OpenVINO GenAI本地部署DeepSeek-R1

本文将基于OpenVINO™ GenAI库，介绍使用三行Python代码，将DeepSeek-R1模型部署到英特尔酷睿Ultra CPU、GPU或NPU的完整过程。

8 小时

推理大模型新范式：从o1到DeepSeek-R1再到QwQ-32B

推理大模型新范式：从o1到DeepSeek-R1再到QwQ-32B ...

5 天

揭秘DeepSeek R1-Zero训练方式，GRPO还有极简改进方案

由于从基础模型进行训练是 R1-Zero 类范式的基本设置，研究人员首先研究广泛使用的开源基础模型，这些模型通常是为了句子补全而训练的。研究人员探索了是否可以通过适当的模板有效地激发其问答能力，从而作为问答基础策略。

知乎专栏 on MSN8 天

老显卡福音！美团开源首发INT8无损满血版DeepSeek R1

美团搜推团队投稿量子位 | 公众号 QbitAI 满血版DeepSeek R1部署A100，基于INT8量化，相比BF16实现50%吞吐提升！美团搜推机器学习团队最新开源，实现对DeepSeek R1模型基本无损的INT8精度量化。要知道，DeepSeek ...

2 天

DeepSeek V3「小版本更新」背后，V3和R1正在融合成一个模型

过去，在DeepSeek的两个模型中，R1是推理模型，而V3则更适合日常对话。如今V3系列也有了推理能力的强力升级，用户可以更好地根据任务难度选择合适的模型：复杂问题用R1，日常对话用新版V3。这种差异化策略让算力资源与任务需求更匹配，避免了不必要的 ...

腾讯网3 天

低风险理财最近为啥一直跌？低风险并不意味着完全无风险，债市 ...

“明明买的是R1低风险理财，最近一直跌！”近日，记者接到市民张先生反映，自己买的低风险理财出现亏损。近期，R1级理财产品亏损现象引发市场广泛关注。多位投资者表示，自今年2月以来，他们购买的R1级固收类理财产品出现亏损，颠覆了他们对低风险理财产品“稳赚 ...

天天基金网2 天

中信银行已部署DeepSeek R1 即将发布人工智能应用发展规划

“我们已经规划了中信银行人工智能应用发展战略，以业务的全面智能化为目标，大力推进垂直的行业模型研发，重点打造在投研、交易和风控等领域的智能体应用，让大模型能力可知、可见、可用，催化大模型技术对业务场景的全面渗透。”谷凌云表示，中信银行 ...

7 天on MSN

腾讯混元T1正式版发布，推理能力媲美DeepSeek-R1，价格更亲民

腾讯近日宣布，其自研的混元大模型系列中的深度思考模型——混元-T1，已正式升级至T1正式版。这一消息标志着腾讯在人工智能领域的又一次重要技术突破。 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果