3月31日,联想集团董事长兼CEO杨元庆在北京表示,即将收官的2024财年,将是联想历史上最好的年份之一。他透露,联想很快就将发布全新AI PC,其本地人工智能推理能力将媲美OpenAI o1-mini。
近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Research 的强化学习研究员 Brad Hilton 和 ...
【新智元导读】在数学推理中,大语言模型存在根本性局限:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,一下子推翻了AI会做数学题这个神话。
在论文发布的版本里,作者评测了包括 GPT-4o,Claude-35-Sonnet, Gemini-1.5-pro-preview 等17个当时最领先的 LLM,每两个模型在每个游戏上进行20轮相互对抗赛(10 轮先手 10 ...
近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别 ...
导语:近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。
他们在 2025 年美国数学奥林匹克竞赛(USAMO)试题发布后立即测试了多个热门模型,结果令人失望:所有模型都表现欠佳,平均得分不到 5%。 结果表明,当前的 LLM ...
DeepSeek团队还将R1蒸馏出了6个小模型并开源给社区,参数从1.5B到70B不等。其中,蒸馏过的R1 32B和70B模型在性能上不仅超越了GPT-4o、Claude 3.5 Sonnet和QwQ-32B,甚至与o1-mini的效果相当。更令人惊叹的是,R1在实现这些卓越性能的同时,成本仅为o1的五十分之一。
杨元庆: 心态,我刚才也讲了,就是一个创业的心态,所以我说我们正在迈入“创业5.0”时代。展望未来,虽然我们方向和战略比较清晰,并前瞻性地确立了混合式人工智能的大方向,但是在竞技场里面有很多同样的选手,谁能够胜出,是完全不确定的。所以我们必须脚踏实地 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果