O1 Mini - 搜索 News

3月31日，联想集团董事长兼CEO杨元庆在北京表示，即将收官的2024财年，将是联想历史上最好的年份之一。他透露，联想很快就将发布全新AI PC，其本地人工智能推理能力将媲美OpenAI o1-mini。

6 天

近日，海外大模型产品平台 OpenPipe 上发布了一项研究，阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Research 的强化学习研究员 Brad Hilton 和 ...

9 小时

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek ...

【新智元导读】在数学推理中，大语言模型存在根本性局限：在美国数学奥赛，顶级AI模型得分不足5%！来自ETH Zurich等机构的MathArena团队，一下子推翻了AI会做数学题这个神话。

腾讯网4 天

17款大模型PK八款棋牌游戏，o3-mini胜出，DeepSeek R1输在中间步骤

在论文发布的版本里，作者评测了包括 GPT-4o，Claude-35-Sonnet, Gemini-1.5-pro-preview 等17个当时最领先的 LLM，每两个模型在每个游戏上进行20轮相互对抗赛（10 轮先手 10 ...

新浪网5 天

GRPO在《时空谜题》中击败o1、o3-mini和R1

近日，海外大模型产品平台 OpenPipe 上发布了一项研究，阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别 ...

雷锋网5 天

GRPO在《时空谜题》中击败o1、o3-mini和R1

导语：近日，海外大模型产品平台 OpenPipe 上发布了一项研究，阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。

腾讯网2 小时

他们在 2025 年美国数学奥林匹克竞赛（USAMO）试题发布后立即测试了多个热门模型，结果令人失望：所有模型都表现欠佳，平均得分不到 5%。结果表明，当前的 LLM ...

头部财经2 天

DeepSeek-R1横空出世，能否成为OpenAI o1的强劲对手？

DeepSeek团队还将R1蒸馏出了6个小模型并开源给社区，参数从1.5B到70B不等。其中，蒸馏过的R1 32B和70B模型在性能上不仅超越了GPT-4o、Claude 3.5 Sonnet和QwQ-32B，甚至与o1-mini的效果相当。更令人惊叹的是，R1在实现这些卓越性能的同时，成本仅为o1的五十分之一。

8 小时

杨元庆的“再创业”，在忙活些什么？

杨元庆：心态，我刚才也讲了，就是一个创业的心态，所以我说我们正在迈入“创业5.0”时代。展望未来，虽然我们方向和战略比较清晰，并前瞻性地确立了混合式人工智能的大方向，但是在竞技场里面有很多同样的选手，谁能够胜出，是完全不确定的。所以我们必须脚踏实地 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果