LSAT - 搜索 News

5 小时

高中生用「我的世界」评测SOTA模型！Claude暂时领先，DeepSeek紧随其后

AI频频刷新基准测试纪录，却算不清「strawberry」里到底有几个字母r，在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起，例如由一名高中生开发的MC-Bench，用Minecraft方块「竞技场」模式评价AI能力。这种新的测评范式，或 ...

3 天

《我的世界》新潮AI评测：高中生创新思维重新定义智能水平

在琳琅满目的技术前沿，直接测评AI的智能程度始终是一个复杂的问题。究竟是让它解数学题、编写代码，抑或是通过标准化考试来进行评测？虽然这些方式在学术上显得相对严谨，但它们常常难以让普通人直观理解AI的能力差异。然而，最近一位高三学生AdiSingh为这个问题提供了一个令人耳目一新的解决方案——通过《我的世界》（Minecraft）评测AI的表现！

3 天

《我的世界》评测AI智能新方式，高三生创立MC-Bench重燃游戏评测热潮！

在这样的背景下，AdiSingh独辟蹊径，创造了MC-Bench，这一平台以《我的世界》作为测试场景，让不同的AI通过相同的提示生成建筑作品。例如，提示可以是“仿若晶莹剔透的酒杯盛满了深红色的葡萄酒，反射出动人心魄的光彩。”然后，由用户评选这些作品的优劣，最后系统才会揭晓出哪个AI完成了该建筑任务。这种评测不仅更加直观，还能有效反映出AI在实际应用中的能力。

9 天

火了！高中生用Minecraft做AI基准，用户看图投票决定大模型排名

从技术上讲，MC-Bench 是一个编程基准，因为模型需要编写代码来创建所提示的构建，如「冰霜雪人」（Frosty the Snowman）或「原始沙滩上迷人的热带海滨小屋」（a charming tropical beach hut on a ...

什么值得买社区频道 on MSN5 天

《我的世界》成为AI新「考场」？

如果要衡量 AI 的智能程度，你会怎么做？让它解数学题、写代码，还是让它通过标准化考试？这些方法虽然严谨，但普通人往往难以直观理解 AI 的能力差异 ...

10 天

原有的模型评测基准OUT了！12岁高中生建立了一个网站，让AI模型 ...

由于传统的AI 基准测试技术已被证明不够充分，AI 开发者开始采用更具创造性的方式来评估生成式 AI 模型的能力。对于一组开发者来说，这就是微软旗下的沙盒建造游戏 Minecraft。 Minecraft Benchmark （或 ...

10 天

高中生利用《我的世界》搭建AI模型评测网站，全民参与评判模型优劣

MC-Bench网站提供了一个直观有趣的AI模型评测方式。开发者们将不同的提示输入到参与测试的AI模型中，模型则会生成相应的《我的世界》建筑。用户可以在不清楚哪个作品由哪个AI模型创建的情况下，对这些建筑进行投票，选出他们认为更符合提示、更优秀的那个。只有在投票结束后，用户才能看到每个建筑背后的“创造者”。这种“盲选”机制旨在更客观地反映AI模型的实际生成能力。

36氪5 天

《我的世界》成为AI新「考场」？高三生用游戏评测AI：DeepSeek-R1位列 ...

例如，AI 模型在 LSAT 法律考试、数学推理测试等标准化考试中得分很高，但在现实应用中仍然容易犯低级错误。 OpenAI 的 GPT-4 能在美国法学院入学 ...

10 天

Minecraft变身AI竞技场:高中生打造创新模型评测平台

高中生Adi Singh与团队合作开发的Minecraft Benchmark（简称MC-Bench）网站允许AI模型在面对面的挑战中相互竞争，通过Minecraft创作来回应各种提示。用户可以投票选出表现更佳的模型，投票后才能看到每个作品背后的AI制作者。

中国教育在线9 天

美国留学可以去吗

部分顶尖大学或热门专业对GPA的要求可能更高。标准化考试成绩：本科申请需参加SAT或ACT考试，而研究生申请则根据专业不同，可能需要提供GRE、GMAT、LSAT等考试成绩。理工科、文科及数学专业要求GRE成绩，商科专业要求GMAT成绩，法律专业要求LSAT成绩等。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果