Sonnet 12 - 搜索 News

1 天

Claude 3.5首战复现21%顶会论文，人类博士无法取代，OpenAI：AI全是草台 ...

AI若能自主复现顶尖科研论文，未来科研将被掀翻天。OpenAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀论文，只有Claude 3.5 Sonnet拔得头筹，但仍无法超越ML博士水平。

2 天

Investing.com — Sonnet BioTherapeutics Holdings, Inc. (NASDAQ: SONN )，一家市值389万美元的微型制药公司，在其总裁、CEO和董事长Pankaj Mohan于2025年3月31日去世后宣布了重大领导层变动。根据 InvestingPro ...

红板报 on MSN10 天

DeepSeek V3-0324 低调发布，代码能力直逼 Claude 3.7 Sonnet

没有铺天盖地的宣传，也没有大张旗鼓的发布会，DeepSeek 在 3 月 24 日晚间低调推出了最新的 V3-0324 版本，目前已在 Hugging Face 开源，可供下载和测试。

搜狐14 天

SuperCLUE：中文大模型基准测评2025年3月报告—2025中文大模型阶段性 ...

今天分享的报告是《中文大模型基准测评2025年3月报告—2025中文大模型阶段性进展3月评估》，版权归SuperCLUE所有。 o3-mini(high) 在 SuperCLUE-3月评测中表现卓越，以 76.01 分和 84.51分稳居总榜和推理任务总榜第一，双榜均领先国内第一近5分，展现出强大的通用推理 ...

51CTO29 天

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具，看谁更厉害！

先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程，功能虽小，但还是能看出差距的。先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet ...

腾讯网1 个月

从 R1 到 Sonnet 3.7，Reasoning Model 首轮竞赛中有哪些关键信号？

DeepSeek R1 催化了 reasoning model 的竞争：在过去的一个月里，头部 AI labs 已经发布了三个 SOTA reasoning models：OpenAI 的 o3-mini 和deep research， xAI 的 Grok 3 和 ...

搜狐1 个月

全球首个混合推理模型Claude 3.7 Sonnet发布！编程能力惊艳四座

在人工智能技术持续演进的大背景下，Anthropic终于推出了其最新力作——Claude 3.7 Sonnet，这一被称为全球首款混合推理模型的智能系统，迅速成为AI社区的焦点。Claude 3.7 Sonnet不仅在推理能力上有了质的飞跃，更将编程能力提升到了崭新的高度，这无疑将为开发者 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果