研究人员采用零样本思维链(zero-shot chain-of-thought)的方法,对18种不同类型的LLM进行了全面测试。这些模型涵盖了长思维链模型、闭源大模型、开源小模型以及数学专用模型等。
新智元报道 ...
2月12日,OpenAI首席执行官Sam Altman表示,OpenAI将在未来几个月推出旗舰产品GPT-5,并将其AI模型整合为更加统一的产品。 Sam ...
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:liyazhou ...
基于实证研究,研究团队发现当面对某些类型的验证码时,LLM与人类用户往往会犯下相似的错误。此外,人类用户常常需要第二次尝试才能成功通过验证码。因此,单靠一个问题来区分AI与人类用户是不够的。
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。Sebastian Raschka ...
最近,来自香港中文大学、北京大学及上海AILab的研究团队联手推动了图像生成领域的重要进展——他们将思维链(CoT)技术与生成模型结合,成功创造出一种新的自回归图像生成模型。实验结果显示,这一创新不仅提升了图像的生成质量,甚至在某些方面超越了现有的扩散模型。
在语言理解MMLU基准测试中,带有示例的提示取得了最佳效果,尤其是与CoT结合时 不过,这其中也有一些奇怪的陷阱:LLM对示例的选择和顺序 ...
得益于在 RL-LLM 方向的不断探索,Kimi 找到了简单却又行之有效的 RL 框架和训练方式,实现了满血版多模态 o1 水平的 k1.5。在 short-CoT 模式下 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果