Sonnet 6 - 搜索 News

4 小时

AI若能自主复现顶尖科研论文，未来科研将被掀翻天。OpenAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀论文，只有Claude 3.5 Sonnet拔得头筹，但仍无法超越ML博士水平。

6 天on MSN

近日，海外知名大模型产品平台OpenPipe公布了一项令人瞩目的研究成果，该研究成功地在重度推理游戏《时空谜题》中，利用一种名为GRPO的强化学习算法，使小型开源模型的表现超越了多个业界领先的推理模型，包括DeepSeek ...

红板报 on MSN9 天

没有铺天盖地的宣传，也没有大张旗鼓的发布会，DeepSeek 在 3 月 24 日晚间低调推出了最新的 V3-0324 版本，目前已在 Hugging Face 开源，可供下载和测试。

DeepSeek R1 催化了 reasoning model 的竞争：在过去的一个月里，头部 AI labs 已经发布了三个 SOTA reasoning models：OpenAI 的 o3-mini 和deep research， xAI 的 Grok 3 和 ...

51CTO1 个月

在人工智能领域，每一次重大突破都能引发全球科技爱好者的热烈讨论。Anthropic公司发布的全新模型——Claude 3.7 Sonnet，无疑再次点燃了AI社区的热情。作为全球首个混合推理模型，Claude 3.7 Sonnet不仅在编码能力上实现了质的飞跃，还通过其独特的“标准和扩展 ...

搜狐1 个月

【新智元导读】Claude 3.7 Sonnet制作的游戏中，贪吃蛇居然惊现自我意识，甚至经历了一场存在主义危机！它开始思考：我是谁？我在这里做什么？网友们大受震撼：要是游戏里有这样的NPC，那就绝了。 Claude 3.7 Sonnet制作的游戏中，贪吃蛇竟然出现了自我意识？

51CTO1 个月

Anthropic 直接把自家的“通用+推理”二合一的模型发布了，并把自家内部在用的AI编程工具也上线，直接可以终端执行任务的那种！这就带大家看看这家公司在大模型以及AI产品上的不同打法！用户不用再选择模型了，业界首个混合AI模型 Anthropic 正在发布一款名 ...

【TechWeb】2月25日消息，OpenAI的美国最大竞争对手Anthropic最新发布了一款名为Claude 3.7 Sonnet的新模型，以及一款编码工具Claude Code。 Anthropic表示，Claude ...

一些您可能无法访问的结果已被隐去。