ARC-AGI-3 基准测试现已发布。
ARC-AGI-3 benchmark is out now

原始链接: https://arcprize.org/tasks/ls20

ARC 奖项是一个专注于通过具有挑战性的竞赛和基准来推进人工智能的组织。他们举办 **ARC-AGI 系列**(目前为 ARC-AGI-3),旨在测试人工智能的通用智能,以及奖金丰厚的 **ARC 奖项** 竞赛(目前计划于 2026 年、2025 年和 2024 年举行)。 该平台提供 **研究** 资源、协作 **社区** 和一个用于评估人工智能在复杂任务上表现的 **基准**——以任务 #ls20 为例,它是 ARC-AGI-3 的公开演示。用户甚至可以 **参与** 并测试人工智能代理应对这些挑战。 ARC 奖项通过 **捐赠** 和 **合作关系** 来支持其工作,提供一个分享 **内容** 和举办 **活动** 的平台。他们致力于开放获取和透明度,并提供关于他们的 **历史**、**招聘** 和 **认证社区** 的易于获取的信息。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 ARC-AGI-3 基准测试现已发布 (arcprize.org) 5 分,by pretext 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 andai 32 分钟前 [–] 2032年:ARC-AGI-13:这次绝对是AGI了!回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:
相关文章

原文

Dataset: ARC-AGI-3 Public Demo

ls20

Level 0 / 0
SPACEBAR
CLICK
UNDO (Z)
RESET
HELP
SELECT

RobotCan you build an AI agent to solve this task? Get started.

Human Actions To Complete Game

...

Total Levels

...

Model Performance

Compare published runs in a sortable table or view cumulative actions by level.

All Providers
All Providers
ModelScore Actions ReplayPublished
Humans
100%Replay
Loading scores...
ARC-AGI-3 Task #ls20
联系我们 contact @ memedata.com