Sonnet 15 - 搜索 News

2 天

Investing.com — Sonnet BioTherapeutics Holdings, Inc. (NASDAQ: SONN )，一家市值389万美元的微型制药公司，在其总裁、CEO和董事长Pankaj Mohan于2025年3月31日去世后宣布了重大领导层变动。根据 InvestingPro ...

人人都是产品经理 on MSN1 天

强制提升ChatGPT-4o、Claude 3.5 sonnet等任何AI模型生成质量的提示词系统

Chatgpt、claude等生成式人工智能平台的崛起，让更多人意识到了“AI的时代已经到来”，而国内deepseek模型中的“深度思考”模式却让全世界为之震撼。

1 天

Claude 3.5首战复现21%顶会论文，人类博士无法取代！OpenAI：AI全是草台 ...

【新智元导读】AI若能自主复现顶尖科研论文，未来科研将被掀翻天。OpenAI最新框架PaperBench正为此生，让AI智能体从头开始复现ICML 2024 20篇优秀论文，只有Claude 3.5 Sonnet拔得头筹，但仍无法超越ML博士水平。

搜狐4 天

OpenAI推出SWE-Lancer基准测试：AI在自由职业软件开发中的挑战与机遇

尽管AI在自然语言处理领域取得了显著进展，初步结果却显示模型在应对这些任务时仍面临不小的考验。最佳模型Claude 3.5 Sonnet在独立编码任务中的成功率仅为26.2%，这显示出AI技术仍有大量改进的空间。基准测试特别强调了深度上下文理解和多项提案评估能力的 ...

生物通2 天

大型语言模型在罕见病识别中的比较分析：助力精准诊断的新突破

为解决罕见病诊断困难（如诊断延迟、误诊等）的问题，研究人员开展了对多种大型语言模型（LLMs）在罕见病识别中有效性的研究。结果显示 LLMs 表现优于人类医生，Claude 3.5 Sonnet 准确率最高。这为临床诊断提供了新工具，有重要意义。

23 小时

OpenAI的AI复现论文新基准，Claude拿了第一名

4 月 3 日，OpenAI 推出了 PaperBench（论文基准测试），这是一个用于评估 AI 智能体自主复现前沿人工智能研究能力的基准测试系统。如果大模型智能体具备了自动写 AI / 机器学习研究论文的能力，既可能加速机器学习领域的发展，同时也需要审慎评估以确保 AI 能力的安全发展。

1 天

OpenAI推出AI Agent评测基准PaperBench

OpenAI在当地时间4月2日正式宣布，推出了一个旨在评估AI智能体复现前沿AI研究能力的基准——PaperBench。该基准的推出，标志着AI领域在评估智能体能力方面迈出了重要一步。

51CTO3 天

港大开源博士级AI智能体，独立完成三篇算法研究，一站式科研6小时 ...

近日，香港大学数据智能实验室推出了一款开源的AI-Researcher系统，以Claude-3.5-sonnet作为核心，兼容DeepSeek、HuggingFace 等主流大模型生态。这三篇论文，出自同一AI之手。随着人工智能技术的迅猛发展，OpenAI提出的五级模型（涵盖从对话系统到协作管理者 ...

腾讯网17 小时

Cartesia: 3 个月融资 9100 万美元，从 Transformer 到 Mamba 重塑语音 AI

作者：linlin编辑：haina2025 年 3 月 11 日，语音生成初创公司 Cartesia 宣布完成 6400 万美元 A 轮融资，距其 2700 万美元种子轮融资仅过去不到 3 个月。本轮融资由 Kleiner Perkins ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果