## Yashiki:基于 Rust 的 macOS 平铺式窗口管理器 Yashiki 是一个为 macOS 12.0+ 构建的、基于 Rust 的平铺式窗口管理器,提供高度可定制和高效的工作流程。它利用基于标签的工作区(使用位掩码实现灵活的窗口组织),并支持具有独立标签配置的多显示器设置。 主要功能包括通过 JSON 协议实现外部布局引擎,允许用户使用任何语言创建自定义布局,以及强大的规则系统,可根据应用程序、标题或其他属性自动配置窗口。配置通过简单的 shell 脚本 (~/.config/yashiki/init) 进行 – 无需禁用 SIP。 Yashiki 提供光标扭曲(鼠标跟随焦点)、状态栏状态流等功能,可通过 Homebrew 安装 (`brew tap typester/yashiki; brew install --cask yashiki`)。它目前处于早期开发阶段,这意味着 API 和配置可能会发生变化。Yashiki 必须授予辅助功能权限才能正常工作。 有几个布局引擎可用(tatami, byobu),可以通过 `cargo install` 安装。提供了丰富的 CLI 工具来管理窗口、标签、布局和配置。
## 可靠性通过验证:摘要
本报告详细介绍了实验,证明了自动化网页交互的可靠性源于强大的*验证*,而不仅仅是更大的模型或更多的视觉数据。核心思想是将网页视为结构化数据——角色、文本、几何形状——并使用明确的断言来控制每个步骤,从而有效地创建一个“适用于代理的Jest”测试框架。
进行了四次亚马逊购物流程的运行,逐渐提高自主性。一个关键结果是:使用小型(约30亿参数)本地执行器与更大的规划器(DeepSeek-R1)配对,并由Sentience的验证层引导,成功完成了完全自主的运行。这与依赖视觉模型形成对比,视觉模型容易产生歧义和静默失败。
验证过程通过界面设计和过滤显著减少了token的使用量(初步测试中减少了约43%)。失败表现为明确的不匹配,从而实现调试,而不是被“进度”掩盖。该系统利用三模型堆栈:一个生成步骤的规划器,一个执行动作的执行器,以及一个确保结果符合预期的验证器。
最终,研究结果表明,一种确定性的、以验证为中心的方法使更小、本地的模型可行且可靠,在成本、隐私和可调试性方面具有优势。这优先考虑*结构而非像素*和*验证而非智能*。