IT之家获悉,李开复给出的四个理由是:数据不足导致传统预训练将终结;超大 GPU 群效率降低,容错问题等导致边际效应降低;超大预训练模型价格昂贵,速度缓慢;新推理 Scaling Law 将带来更高回报。超大预训练模型的价值正在转移,将进一步体现在“教师模型”的角色中,其本质也将 更趋进于大模型时代的基础设施 。旧学习范式是人教 AI,新学习范式是 AI 教 AI 。