“完美人工智能压力测试:再见,傻瓜”由四位博弈论家于1950年设计,其中包括约翰·纳什(“美丽心灵”中的人物)。这个游戏有一个残酷的特性:背叛在数学上是获胜的必要条件。这使其成为评估人工智能能力的理想选择,而标准基准无法做到这一点:战略欺骗——人工智能能否令人信服地撒谎?信任建模——它知道何时信任,何时背叛?多智能体谈判——它如何处理联盟?长期规划——它能否提前几步设置背叛?快速规则:4名玩家,每人拥有彩色筹码。轮流在堆上放置筹码。如果你的筹码与下面的筹码匹配,你就可以获得该堆。筹码用完?向他人求助——或者被淘汰。最后幸存的玩家获胜。观看完整教程(15分钟)→
## AI聊天机器人能耗:细致分析
近期分析表明,个人使用像ChatGPT这样的AI聊天机器人对个人电力和用水的影响微乎其微。对于普通用户来说,每日提问消耗的资源在其总体足迹中占比可以忽略不计——低于一秒的淋浴时间。然而,对于大量使用编码代理的软件开发者等“重度用户”来说,情况则大不相同。
一项对Claude Code会话的分析估计,每次会话消耗约41Wh,是典型查询的138倍。全天使用此类代理进行编码,其能耗相当于运行洗碗机或小型冰箱。虽然这种影响仍然可能很大,但这并不一定是避免使用AI的理由,而是呼吁支持向可再生能源过渡,为这些计算提供动力。
作者认为,他个人的使用情况值得向推广AI绿色能源的组织捐款,例如ClimateAction.tech。重要的是,这些计算依赖于估计值,因为AI实验室缺乏关于能耗数据的透明度——他们应该优先考虑透明度。最终,通过更广泛的生活方式改变来减少整体碳足迹,对于大多数用户来说仍然更有效。
## Fence:安全运行不受信任的代码
Fence 是一个为 CLI 设计的沙箱工具,旨在以受控的访问权限运行潜在的风险代码——例如包安装、构建脚本或来自 AI 代理的代码。它**默认阻止所有网络访问**,并根据可配置的规则限制文件系统操作和命令。
您可以定义允许的域名、可写目录和禁止的命令,或使用**预构建模板**(例如 npm/pypi 的“code”)。Fence 跨平台工作(macOS 和 Linux),使用原生沙箱技术。
主要功能包括:
* **网络隔离:** 除非明确允许,否则阻止所有出站连接。
* **文件系统控制:** 限制对特定路径的读/写访问。
* **命令阻止:** 防止执行危险命令。
* **监控模式:** 识别和记录尝试的违规行为。
Fence 可作为 CLI 工具或 Go 包使用,其灵感来自 Anthropic 的 sandbox-runtime,为执行不受信任的代码提供了一层宝贵的安全性。