【新智元导读】在数学推理中,大语言模型存在根本性局限:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,一下子推翻了AI会做数学题这个神话。
在近日举行的重要会议上,联想集团董事长兼首席执行官杨元庆宣布,联想将在接下来的十年中,定义为“人工智能的十年”,并迎来历史上的第五次创业。这一表态显示出联想在AI领域的雄心,预示着其将全力以赴推动战略、资金和产品开发的全面转型。
他们在 2025 年美国数学奥林匹克竞赛(USAMO)试题发布后立即测试了多个热门模型,结果令人失望:所有模型都表现欠佳,平均得分不到 5%。 结果表明,当前的 LLM ...
AGI-Eval评测社区团队 投稿量子位 | 公众号 ...
杨元庆: 心态,我刚才也讲了,就是一个创业的心态,所以我说我们正在迈入“创业5.0”时代。展望未来,虽然我们方向和战略比较清晰,并前瞻性地确立了混合式人工智能的大方向,但是在竞技场里面有很多同样的选手,谁能够胜出,是完全不确定的。所以我们必须脚踏实地 ...
首个推理模型在正式开源之前,也会根据OpenAI准备框架进行评估。同时,也会让一部分内测用户(从旧金山开始),参与早期原型评估。
一项新研究表明,OpenAI 可能在未获授权的情况下,使用 O'Reilly 出版社的付费图书来训练其先进的 AI 模型。研究发现,与早期模型相比,OpenAI 的 GPT-4o 模型对 O'Reilly ...
2025年4月1日,AI界扔下了一颗“重磅炸弹”!OpenAI首席执行官SamAltman,在社交媒体上大手一挥宣布:未来几个月,将推出自GPT-2以来首个带推理能力的开放权重语言模型。好家伙,这消息一放出,整个AI江湖瞬间炸开了锅。
估值高达3000亿美元!OpenAI完成新一轮融资,openai,微软,软银,初创公司,马斯克 ...
北京时间4月1日,OpenAI首席执行官山姆·奥尔特曼(Sam Altman)宣布完成新一轮400亿美元融资。 该公司投后的估值达到3000亿美元,仅次于SpaceX的3500亿美元,比肩TikTok母公司字节跳动,成为全球估值最高的私有公司之一 。
全面体验 ChatGPT 中文版,无需翻墙,支持 GPT-4、4o、o1、o3 和 DeepSeek R1 及中文多功能应用! 本项目旨在为用户提供一站式的 ChatGPT 中文版使用指南,同时整理了国内可用的 ChatGPT 镜像网站和官网使用教程,帮助您快速上手 ChatGPT,无论是个人使用还是专业需求。