近日,海外大模型产品平台 OpenPipe 上发布了一项研究,阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Research 的强化学习研究员 Brad Hilton 和 ...
标题:Claude 3.7 AI破局:50万token上下文窗口,引领AI新纪元 随着人工智能技术的不断发展,越来越多的企业开始关注并投入AI领域。其中,Anthropic公司的Claude 3.7 Sonnet模型凭借其强大的上下文窗口功能,正在引领AI新纪元的到来。近日,该公司计划将该模型的上下文窗口从20万token跃升至50万token,这一举措无疑将为复杂任务如政治文档分析、超长代码库管 ...
昨晚,DeepSeek 无预警发布了 DeepSeek-V3-0324 模型。虽然官方低调地称其为“小版本迭代”,但实测表现远超预期。该模型在代码生成、前端开发等方面显著提升,部分能力甚至比肩 Claude 3.7 Sonnet,引发了全球 AI ...
DeepSeek R1 催化了 reasoning model 的竞争:在过去的一个月里,头部 AI labs 已经发布了三个 SOTA reasoning models:OpenAI 的 o3-mini 和deep research, xAI 的 Grok 3 和 ...
在AI界,没有最强,只有更强。 今天,AI初创公司Anthropic推出了首款混合推理模型Claude 3.7 Sonnet,这是Claude系列迄今为止最智能的模型。Claude 3.7 Sonnet可以产生近乎即时的响应,也可以向用户提供扩展的、逐步的思考。API 用户还可以对模型的思考时间进行精细控制。
该公司介绍,Claude 3.7 Sonnet既能提供接近即时的响应,也能展示分步骤的详细思考过程。 API用户还可对模型的思考时长进行精细化控制。