## ARC-AGI-3:一项衡量真正人工智能的基准 ARC-AGI-3 是一项具有挑战性的基准,旨在衡量通往通用人工智能(AGI)的进展。它不同于专注于静态问题解决的传统人工智能测试,而是评估人工智能体在**动态、新颖环境中学习和适应**的能力——就像人类一样。 该基准要求人工智能体探索、设定自身目标、构建对世界的理解,并通过经验不断改进,*无需*依赖明确的指令。成功定义为在可解决的环境套件中匹配人类效率。 ARC-AGI-3 独特地衡量随*时间*推移的智能,评估诸如长期规划、记忆和信念更新等因素——这些是人工智能目前落后于人类的领域。其设计优先考虑人类的简单性,避免依赖预先存在的知识,并防止基于记忆的解决方案,从而提供对真正学习和适应能力的可靠衡量。最终,ARC-AGI-3 旨在量化人工智能与人类智能之间的差距。