AGI 终极前沿：CLJ-AGI 基准测试

AGI 终极前沿：CLJ-AGI 基准测试
The AGI Final Frontier: The CLJ-AGI Benchmark

原始链接: https://raspasov.posthaven.com/the-agi-final-frontier-the-clj-agi-benchmark

我提议一项新的AGI基准测试，名为CLJ-AGI。当一个AI系统能够完成以下任务时，我们就达到了AGI：输入：我需要你增强Clojure语言，添加以下变更和特性。你可以创建一种新语言。但是，如果你能保持与现有Clojure的完全兼容性，你将获得一位特殊人物颁发的一项非常有价值的奖励。 * 以transducer为先的设计 * 消除惰性求值，或在所有地方尽可能地采用选择加入的协议（性能优先） * 一级数据结构/类型同时也是CRDT数据类型，在可行的情况下（正确性和性能） * 一级maps、vectors、arrays、sets、counters等等输出：一种新的（或改进的）编程语言。

## 人工通用智能的终极前沿：基准测试与未来展望最近在Hacker News上进行了一场关于定义人工智能通用（AGI）有意义基准测试的讨论。核心观点是，基准测试充当了人工智能研究人员的提示——将复杂问题转化为可解决的任务，通过足够的努力，最终会被“饱和”并解决。参与者集思广益，提出了雄心勃勃的“AGI终极前沿”项目，范围从用高级人工智能重新实现像《星际霸主》这样复杂的游戏，到用Rust重构Linux实用工具。一个关键点是，需要超越代码的基准测试，解决现实世界的挑战，例如设计和制造物理机器（例如，一台2000美元的金属3D打印机）。对话探讨了一款真正有能力的AGI可能*实现*的可能性——个性化软件和创新的涌现，但也需要工具来管理这些输出。讨论中存在关于现有语言（如Clojure）是否已经具备高级AGI所需的功能，以及实现与规范在定义“创造”的语言中的重要性的争论。最终，讨论强调了基准测试的价值，它不仅需要正确的解决方案，还需要对模糊要求的解释和迭代意愿。

I propose a new AGI benchmark called CLJ-AGI.

We will know when we have reached AGI when an AI system can do the following:

Input:

I need you to enhance the Clojure language with the changes and features listed below. You are allowed to create a new language. However, if you manage to keep everything backward compatible with existing Clojure, you will be rewarded with a very valuable award by a very special person.

transducer-first design, laziness either eliminated or opt-in
protocols everywhere as much as practically possible (performance)
first-class data structures/types are also CRDT data types, where practical (correctness and performance)
first-class maps, vectors, arrays, sets, counters, and more

Output:

A new (or improved) programming language.

AGI 终极前沿：CLJ-AGI 基准测试 The AGI Final Frontier: The CLJ-AGI Benchmark

AGI 终极前沿：CLJ-AGI 基准测试
The AGI Final Frontier: The CLJ-AGI Benchmark