LLM Cot - 搜索 News

11 小时

研究人员采用零样本思维链（zero-shot chain-of-thought）的方法，对18种不同类型的LLM进行了全面测试。这些模型涵盖了长思维链模型、闭源大模型、开源小模型以及数学专用模型等。

新智元报道 ...

2月12日，OpenAI首席执行官Sam Altman表示，OpenAI将在未来几个月推出旗舰产品GPT-5，并将其AI模型整合为更加统一的产品。 Sam ...

6 天

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou ...

2 天

基于实证研究，研究团队发现当面对某些类型的验证码时，LLM与人类用户往往会犯下相似的错误。此外，人类用户常常需要第二次尝试才能成功通过验证码。因此，单靠一个问题来区分AI与人类用户是不够的。

5 天

著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次，他将立足于 DeepSeek 技术报告，介绍用于构建推理模型的四种主要方法，也就是如何通过推理能力来增强 LLM。Sebastian Raschka ...

6 天

最近，来自香港中文大学、北京大学及上海AILab的研究团队联手推动了图像生成领域的重要进展——他们将思维链（CoT）技术与生成模型结合，成功创造出一种新的自回归图像生成模型。实验结果显示，这一创新不仅提升了图像的生成质量，甚至在某些方面超越了现有的扩散模型。

来自MSN8 个月

在语言理解MMLU基准测试中，带有示例的提示取得了最佳效果，尤其是与CoT结合时不过，这其中也有一些奇怪的陷阱：LLM对示例的选择和顺序 ...

得益于在 RL-LLM 方向的不断探索，Kimi 找到了简单却又行之有效的 RL 框架和训练方式，实现了满血版多模态 o1 水平的 k1.5。在 short-CoT 模式下 ...

一些您可能无法访问的结果已被隐去。