Arc AGI - 搜索 News

18 小时

LeCun痛批硅谷傲慢病！圈内爆火长文：DeepSeek R1-Zero比R1更重要，成AGI ...

导读：奥特曼罕见地承认了自己犯下的‘历史错误’，LeCun发文痛批硅谷一大常见病——错位优越感。DeepSeek的终极意义在哪？圈内热转的这篇分析指出，相比R1，R1-Zero具有更重要的研究价值，因为它打破了终极的人类输入瓶颈！

4 天

为什么说DeepSeek的R1-Zero比R1更值得关注？

他认为，R1-Zero 之所以比 R1 更值得分析，是因为它完全依赖强化学习（RL），而不使用人类专家标注的监督微调（SFT），这表明在某些任务中，人类标注并非必要，且未来可能通过纯 RL 方法实现更广泛的推理能力。

2 天

股市风向标 | DeepSeek R1-Zero成为AGI发展关键

在近期的市场动态中，DeepSeek的R1-Zero系统引发了广泛关注，甚至对全球科技公司产生重要影响。根据新智元的报道，R1-Zero在ARC-AGI-1基准测试中表现出色，得分与OpenAI的o1系统相当，标志着AI推理计算领域的重大进步。R1- ...

腾讯网28 天

深度｜OpenAI预演o3模型：推理能力实现飞跃，在ARC AGI挑战取得突破性 ...

今天，OpenAI预览了他们的o3模型，延续了近期在训练语言模型以使用o1进行推理方面的进展。这些模型从o3-mini开始，预计将在2025年1月底向公众开放。在我们即将结束2024年时，许多敏锐的观察者将这一年视为人工智能领域的整合之年，许多参与者达到了GPT-4等效模型的水平，并开始探索如何实际应用这些模型。

腾讯网1 个月

o3挑战ARC-AGI，遇见大网格就懵圈？英国工程师：ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩，属实给人类带来了不少震撼。但有人专门研究了它不会做的题之后，有了更有趣的发现—— o3之所以不会做这些题，原因可能不是因为太难，而是题目的规模太大了。来自英国的ML工程师Mikel Bober-Irizar（不妨叫他米哥），对ARC ...

腾讯网12 天

OpenAI CEO：多亏了特朗普！AGI将在美国实现

OpenAI首席执行官对AGI的前景感到乐观，“如果换了其他总统，这可能就无法实现了”。 OpenAI首席执行官山姆·奥尔特曼（Sam ...

15 天

2025年，AI会抢走你的工作吗？

用大白话来讲，在解决一个人类最多需要几分钟就能搞定的网格模式问题时，o3平均每项任务要花费 5700 万个Token（词元，约相当于 4000 多万个单词），总计花费 5000 美元。

来自MSN8 天

OpenAI o3 是 AGI 吗？有何优势？

不是，而且幸好不是！ OpenAI的o3在科学、数学、编程等方面的评测再创佳绩，有很多评测基准已经显得饱和了，饱和的意思就是100分拿了90分以上，拿更高的分已经不能体现能力强多少了。更令人注意的是，在号称专门为AGI准备的ARC测试中，o3拿了87 ...

腾讯网1 个月

OpenAI如何叩响AGI之门：12天12场直播，秀出哪些新肌肉

当地时间12月5日-20日，人工智能巨头OpenAI完成了连续12个工作日的12场直播，从首日的满血版o1模型重磅发布，再到期待许久的Sora Turbo正式发布，最终又以新一代推理模型o3收官，OpenAI CEO山姆·奥特曼（Sam Altman ...

36氪18 天

Keras之父创业押注「程序合成」，副业竟能解锁终极AGI，o3预示新拐点

人生下一站：AGI 这一次，并非是两人第一次联手合作。 Chollet和Knoop是ARC Prize Foundation的联合创始人和董事会成员，该基金会是非营利组织，致力于 ...

来自MSN1 个月

OpenAI o3是AGI吗

特别是在ARC-AGI的测式中取得了大幅度的突破。是否意味着2025年人类可以看到AGI的曙光？我们在这里编译了ARC-AGI测试标准的创始人撰写的o3测评的报告。

来自MSN1 个月

OpenAI 发布 o3 模型，成为首个突破 ARC-AGI 测试的模型

就在不久之前也就是 OpenAI 的第十二天发布会上发布了全新的推理模型 o3 和 o3-mini，这个模型创造了记录成为首个突破 ARC-AGI 基准测试的 AI 模型 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果