展示HN:LLM难以应对的1v1编程游戏
Show HN: 1v1 coding game that LLMs struggle with

原始链接: https://yare.io

等待中... muffin-bot 不攻击,适合早期测试。 cleo-bot 更聪明的机器人,但有点过于激进。 clowder-bot 健谈的机器人,每只猫都有不同的角色。游戏中目前最强的机器人。 复制链接 等待朋友连接...

## Yare.io:一款挑战大型语言模型的1v1编程游戏 Yare.io 是一款极简、开源的1v1编程游戏,玩家使用JavaScript编程控制单位进行快速(小于3分钟)的战斗。它是一个出于热情的个人项目,旨在让新手程序员容易上手,同时仍具有很高的技能上限——这是创造者在学习编程时希望存在的东西。 Yare最近经过简化改造,结果却出人意料地对大型语言模型(LLM)来说非常困难。 创造者运营着一个“AI竞技场”(yare.io/ai-arena),展示了当前的模型,例如Gemini 3.1,难以战胜像Clowder这样更简单的机器人,这可能是由于空间推理问题或缺乏相关的训练数据造成的。 这个项目之前曾在Hacker News上分享过(原始帖子中提供了链接),并欢迎社区的反馈。 你可以在GitHub上找到代码:[https://github.com/riesvile/yare](https://github.com/riesvile/yare)。
相关文章

原文

Waiting...

muffin-botDoesn't attack, good for early testing

cleo-botSmarter bot that's a little too aggressive

clowder-botChatty bot where each cat has different role

Current strongest bot in the game.

Copy link

Waiting for a friend to connect...

联系我们 contact @ memedata.com