## Ferret-UI Lite:一款紧凑型GUI智能体 本文介绍Ferret-UI Lite,一种30亿参数的GUI智能体,专为在移动、网页和桌面平台上的高效本地运行而设计。为了应对构建有效GUI交互智能体,同时限制模型大小的挑战,研究人员采用了一系列技术。 这些技术包括精心策划的真实和合成GUI数据集、通过思维链提示和视觉工具使用增强推理能力,以及利用有针对性的奖励进行强化学习。 Ferret-UI Lite在与其他小型智能体相比,表现出具有竞争力的性能,在标准基准测试中取得了强劲的结果:在ScreenSpot-V2(GUI定位)上达到91.6%的准确率,在AndroidWorld和OSWorld(GUI导航)上分别达到28.0%和19.8%的成功率。作者分享了他们的研究方法和见解,以帮助进一步开发适用于本地应用的紧凑型、实用的GUI智能体。
## BuildKit:不仅仅是Dockerfile构建器
BuildKit是一个强大、可插拔的构建框架,是`docker build`的基础,但其功能远不止于构建容器镜像。它是一个通用的系统,用于将构建定义为文件系统操作的有向无环图。
其核心是**LLB(低级别构建定义)**,一种表示构建步骤的二进制格式,可实现内容寻址缓存,从而提高速度和可重复性。**前端**将构建定义(如Dockerfile、YAML或自定义DSL)转换为LLB,使构建*语言*灵活且可定制。然后,**求解器**执行LLB图,利用缓存和并行化。
BuildKit不限于镜像;其`--output`标志允许将构建导出为tarball、本地目录或APK和RPM等软件包。Earthly和Dagger等项目展示了这一点,利用BuildKit的引擎进行CI/CD和复杂构建。最近的例子`apkbuild`展示了直接从YAML规范构建Alpine软件包,*无需*Dockerfile。
本质上,BuildKit提供了一个强大、预构建的构建引擎,处理缓存、并行化和可重复性,让开发者专注于定义*构建什么*,而不是*如何构建*。