AGI 终极前沿:CLJ-AGI 基准测试
The AGI Final Frontier: The CLJ-AGI Benchmark

原始链接: https://raspasov.posthaven.com/the-agi-final-frontier-the-clj-agi-benchmark

我提议一项新的AGI基准测试,名为CLJ-AGI。当一个AI系统能够完成以下任务时,我们就达到了AGI: 输入:我需要你增强Clojure语言,添加以下变更和特性。你可以创建一种新语言。但是,如果你能保持与现有Clojure的完全兼容性,你将获得一位特殊人物颁发的一项非常有价值的奖励。 * 以transducer为先的设计 * 消除惰性求值,或在所有地方尽可能地采用选择加入的协议(性能优先) * 一级数据结构/类型同时也是CRDT数据类型,在可行的情况下(正确性和性能) * 一级maps、vectors、arrays、sets、counters等等 输出:一种新的(或改进的)编程语言。

## 人工通用智能的终极前沿:基准测试与未来展望 最近在Hacker News上进行了一场关于定义人工智能通用(AGI)有意义基准测试的讨论。核心观点是,基准测试充当了人工智能研究人员的提示——将复杂问题转化为可解决的任务,通过足够的努力,最终会被“饱和”并解决。 参与者集思广益,提出了雄心勃勃的“AGI终极前沿”项目,范围从用高级人工智能重新实现像《星际霸主》这样复杂的游戏,到用Rust重构Linux实用工具。一个关键点是,需要超越代码的基准测试,解决现实世界的挑战,例如设计和制造物理机器(例如,一台2000美元的金属3D打印机)。 对话探讨了一款真正有能力的AGI可能*实现*的可能性——个性化软件和创新的涌现,但也需要工具来管理这些输出。 讨论中存在关于现有语言(如Clojure)是否已经具备高级AGI所需的功能,以及实现与规范在定义“创造”的语言中的重要性的争论。最终,讨论强调了基准测试的价值,它不仅需要正确的解决方案,还需要对模糊要求的解释和迭代意愿。
相关文章

原文

I propose a new AGI benchmark called CLJ-AGI.

We will know when we have reached AGI when an AI system can do the following:

Input:

I need you to enhance the Clojure language with the changes and features listed below. You are allowed to create a new language. However, if you manage to keep everything backward compatible with existing Clojure, you will be rewarded with a very valuable award by a very special person.

  • transducer-first design, laziness either eliminated or opt-in
  • protocols everywhere as much as practically possible (performance)
  • first-class data structures/types are also CRDT data types, where practical (correctness and performance)
  • first-class maps, vectors, arrays, sets, counters, and more

Output:

A new (or improved) programming language.

联系我们 contact @ memedata.com