Sonnet 12 - 搜索 News

1 天

OpenAI新基准测试揭示Claude-3.5-Sonnet强势领先，AI技术革新再引关注

在人工智能领域，技术革新不断推动行业前行。最近，OpenAI推出新基准测试PaperBench，聚焦于AI智能体在复现ICML2024顶会论文中的表现，以期提升AI的综合能力。根据测试结果，新版Claude-3.5-Sonnet显著超越其他竞争对手， ...

2 天

Sonnet BioTherapeutics任命临时CEO和新总裁

Investing.com — Sonnet BioTherapeutics Holdings, Inc. (NASDAQ: SONN )，一家市值389万美元的微型制药公司，在其总裁、CEO和董事长Pankaj Mohan于2025年3月31日去世后宣布了重大领导层变动。根据 InvestingPro ...

1 天

Claude 3.5首战复现21%顶会论文，人类博士无法取代，OpenAI：AI全是草台 ...

AI若能自主复现顶尖科研论文，未来科研将被掀翻天。OpenAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀论文，只有Claude 3.5 Sonnet拔得头筹，但仍无法超越ML博士水平。

英为财情3 天

Sonnet BioTherapeutics在创始人去世后任命临时CEO

Investing.com — Sonnet BioTherapeutics Holdings, Inc. (NASDAQ:SONN)，一家市值为411万美元的专注于肿瘤治疗的生物技术公司，宣布任命Raghu Rao为临时首席执行官，此举是在创始人兼CEO Pankaj Mohan博士意外去世后作出的。根据InvestingPro分析，尽管该公司在过去一年股价下跌了91% ...

8 天

DeepSeek的一次小更新堪比发布新模型

根据官方更新的版本说明， DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强，写作风格实现了跟 R1 对齐，另外还有一些其他方面的小优化。不过有一说一，虽然 V3-0324 仅仅只是 V3 ...

10 天

DeepSeek V3-0324 低调发布，代码能力直逼 Claude 3.7 Sonnet

没有铺天盖地的宣传，也没有大张旗鼓的发布会，DeepSeek 在 3 月 24 日晚间低调推出了最新的 V3-0324 版本，目前已在 Hugging Face 开源，可供下载和测试。

新浪网8 天

DeepSeek的一次小更新堪比发布新模型

只能说，这把 Claude 3.7 Sonnet 赢得很彻底 ... 最厉害的非推理模型GPT-4.5都要更胜一筹。去年 12 月底 V3 上线，紧接着 R1 就在过年的时候上桌吃饭 ...

51CTO9 天

DeepSeek V3深夜低调升级，代码进化令人震惊，网友实测可媲美Claude 3.5 ...

模型放出来后，DeepSeek-V3-0324 的代码能力让所有人震惊了！有人表示，经过自己的测试，DeepSeek-V3-0324 在数学推理和前端开发方面的表现优于 Claude 3.5 和 Claude 3.7 Sonnet。 X 博主「@KuittinenPetri」表示，Anthropic 和 OpenAI 陷入了困境。更新后的 DeepSeek-V3-0324 可以轻松 ...

腾讯网18 小时

日前OpenAI推出并开源全新AI Agent评测基准

当地时间4月2日，OpenAI方面宣布推出并开源一个全新的、名为PaperBench的AI智能体（AI ...

人人都是产品经理 on MSN8 天

地表最强，Gemini 2.5Pro发布！多模型对比实测到底如何？请看文章

Google近期发布的Gemini 2.5 Pro Experimental模型，以其卓越的性能和多模态处理能力，引发了业界的广泛关注。本文将详细介绍Gemini 2.5 Pro的关键特性，并通过与多个主流模型的对比实测，深入分析其在不同任务中的表现 ...

红板报 on MSN1 天

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

梦晨发自凹非寺量子位 | 公众号 QbitAI OpenAI承认Claude是最好的了（狗头）。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果