每日HackerNews RSS

## Ferret-UI Lite:一款紧凑型GUI智能体 本文介绍Ferret-UI Lite,一种30亿参数的GUI智能体,专为在移动、网页和桌面平台上的高效本地运行而设计。为了应对构建有效GUI交互智能体,同时限制模型大小的挑战,研究人员采用了一系列技术。 这些技术包括精心策划的真实和合成GUI数据集、通过思维链提示和视觉工具使用增强推理能力,以及利用有针对性的奖励进行强化学习。 Ferret-UI Lite在与其他小型智能体相比,表现出具有竞争力的性能,在标准基准测试中取得了强劲的结果:在ScreenSpot-V2(GUI定位)上达到91.6%的准确率,在AndroidWorld和OSWorld(GUI导航)上分别达到28.0%和19.8%的成功率。作者分享了他们的研究方法和见解,以帮助进一步开发适用于本地应用的紧凑型、实用的GUI智能体。

## Ferret-UI Lite 与设备端 AI 代理 - Hacker News 总结 最近 Hacker News 的讨论集中在苹果的“Ferret-UI Lite”上,这是一种小型设备端 GUI 代理,详细信息见新论文 (arxiv.org/pdf/2509.26539)。用户对苹果的 Foundation Models 框架印象深刻,特别是它在将指令转换为应用程序内的工具使用方面的速度和准确性,设想未来本地、私密的 AI 可以用于转录和图像理解等任务。 然而,一些人对苹果依赖截图进行视觉识别表示失望,认为利用现有的辅助功能标注——UI 元素的结构化“DOM”——将更有效和安全。这呼应了苹果过去的“虚拟用户”系统。 共识倾向于混合方法:将视觉作为后备方案,同时优先使用“App Intents”——内置安全性和用户同意的策划动作图——供开发者使用。虽然承认标准化应用程序界面具有挑战性,但讨论强调了苹果可以通过可控、安全的 AI 来区分其平台。

这篇短文告诫人们不要对人工智能(AI)过度炒作,并将它与过去许多被过度承诺的技术相提并论——从3D电视和豆豆熊到元宇宙和Quibi。作者指出了一种模式:那些曾经热情推崇过去失败技术的人,现在又宣称AI是*那个*革命性的未来。 引用约翰·腾普尔顿爵士关于相信“这次不一样”的危险的警告,文章认为AI很可能只是众多技术中的*一种*,而不是一个能够改变世界的单一力量。它使用了特里·普拉切特对安克-莫波克的类比,来说明系统如何适应并吸收甚至具有颠覆性的力量,从而防止被完全接管。 最终,这篇文章提倡一种现实的视角,认为驱动AI投资的“赢者通吃”理念是不可持续的,并且缺乏历史先例的支持。

去年八月,我们的Gemini图像模型Nano Banana迅速走红,重新定义了图像生成和编辑。去年十一月,我们发布了Nano Banana Pro,为用户提供先进的智能和工作室级别的创作控制。今天,我们将两者的优势带给Google上的用户。推出Nano Banana 2 (Gemini 3.1 Flash Image),我们最新的最先进图像模型。现在,您可以以闪电般的速度获得Nano Banana Pro中您喜爱的先进世界知识、质量和推理能力。

这是一个高度交互的网络应用程序,需要JavaScript。简单的HTML界面是可能的,但这并非如此。Robert Reich (rbreich.bsky.social) 发布:plc:4u3hwe3p7oy3hoy3amlw7rp2 2025年,Meta的实际联邦税率为3.5%——这是其历史最低水平。与此同时,Meta今年正在投入6500万美元用于选举,以支持对人工智能友好的候选人。涓滴经济学不仅是一个骗局,它还会腐蚀民主。大钱是我们功能失调的根源。2026-02-25T23:30:12.954Z

## Z3 SMT 求解器:探索《程序员的逻辑》中的“ chaff ” 本文详细介绍了在编写《程序员的逻辑》时被舍弃的代码示例(“chaff”),重点关注 Z3 SMT(可满足性模理论)求解器。Z3 通过为变量赋值以满足给定的方程来解决问题,处理数学和编程概念。它的使用方式类似于代数求解器——提供约束,Z3 尝试找到一个模型(解)。 作者通过各种脚本探索 Z3 的功能,从简单的数学问题开始,逐步扩展到更复杂的场景,例如寻找满足特定条件的不同的整数集合,优化为实现财务目标进行的年度存款,甚至逆向工程伪随机数生成器(如 LCG)。Z3 还可以通过尝试找到陈述的反例来进行定理证明。 一个突出的关键挑战是 Z3 处理数组的方式,数组更类似于键值映射,而不是传统的索引列表,需要仔细定义约束。虽然功能强大,但 Z3 的优化功能比专用求解器慢。最终,作者选择的书籍示例优先考虑可理解性、实用相关性和展示 Z3 独特优势——传统约束求解器难以解决的问题,例如字符串操作或形式化验证。还提供了资源和进一步探索的链接。

一个Hacker News的讨论围绕着Z3,一个强大的定理证明器和SMT求解器。最初的帖子链接到展示Z3能力的脚本,引发了关于其可靠性的争论。一位评论者最初质疑了一个定理证明的例子,指出Z3可能会返回“未知”结果,而不是明确的“满足”(sat)或“不满足”(unsat)——原始作者承认并纠正了这一点。 有趣的是,另一位用户声称使用Z3“证明”了费马大定理,并发现通过*减少*超时变量可以提高性能。其他人解释了Z3的实际应用,包括在编译时进行静态分析以检测错误,本质上是验证代码中的逻辑。对话涉及编译器和SAT求解器之间的关系,一些人指出编译器通常依赖于启发式方法,而不是完全的定理证明。一个幽默的插曲提到了将“Z3”误解为德国电脑的情况。

## BuildKit:不仅仅是Dockerfile构建器 BuildKit是一个强大、可插拔的构建框架,是`docker build`的基础,但其功能远不止于构建容器镜像。它是一个通用的系统,用于将构建定义为文件系统操作的有向无环图。 其核心是**LLB(低级别构建定义)**,一种表示构建步骤的二进制格式,可实现内容寻址缓存,从而提高速度和可重复性。**前端**将构建定义(如Dockerfile、YAML或自定义DSL)转换为LLB,使构建*语言*灵活且可定制。然后,**求解器**执行LLB图,利用缓存和并行化。 BuildKit不限于镜像;其`--output`标志允许将构建导出为tarball、本地目录或APK和RPM等软件包。Earthly和Dagger等项目展示了这一点,利用BuildKit的引擎进行CI/CD和复杂构建。最近的例子`apkbuild`展示了直接从YAML规范构建Alpine软件包,*无需*Dockerfile。 本质上,BuildKit提供了一个强大、预构建的构建引擎,处理缓存、并行化和可重复性,让开发者专注于定义*构建什么*,而不是*如何构建*。

## BuildKit:强大但复杂 最近在Hacker News上的一场讨论,展现了对Docker容器构建工具BuildKit的细致看法。虽然BuildKit因其诸如构建去重等特性而受到赞扬,但经验丰富的用户,如Depot的Kyle Galbraith,警告说它是一个复杂的“自研想法集合”,需要大量的维护,甚至为了实际使用需要进行分叉。 核心问题在于,尽管BuildKit功能强大,但它难以理解和扩展。其他人也表达了类似的观点,指出构建系统常常会变成具有个性的“个人项目”,其中未记录的原理隐藏在开发者的知识中。 尽管存在这些挑战,BuildKit仍然提供有价值的功能,例如通过挂载进行缓存和安全的SSH代理转发。然而,实现可靠的缓存,尤其是在CI/CD环境中,可能很棘手。一些用户提倡使用Podman/Buildah或Nix等替代方案,理由是BuildKit的缓存问题和整体复杂性。这场讨论也指出了一个更广泛的问题:构建系统本质上很难设计得很好,通常会优先考虑速度和功能,而不是清晰的架构。

## just-bash:为AI代理提供安全、沙箱化的Bash环境 just-bash是一个TypeScript库,提供模拟的Bash环境,非常适合需要安全隔离执行空间的AI代理。它在内存中运行,并使用虚拟文件系统,防止访问主机系统。 主要特性包括: * **沙箱化:** 限制访问权限,仅限于提供的文件系统,防止意外的系统更改。 * **执行保护:** 防止无限循环和过度递归。 * **可选网络访问:** 支持`curl`,并具有可配置的URL允许列表和方法限制,以进行安全的网络请求。默认禁用。 * **文件系统灵活性:** 提供多种实现方式——内存、覆盖(写时复制)、读写和可挂载,以满足不同的需求。文件甚至可以是函数,用于动态内容。 * **可扩展性:** 可以使用TypeScript定义自定义命令。 * **Vercel沙箱兼容性:** 与`@vercel/sandbox` API兼容,可扩展到完整的虚拟机。 * **CLI工具:** `just-bash`命令行界面提供了一个安全的标准Bash替代方案。 目前处于Beta阶段,旨在进行实验和反馈。它不支持二进制文件或WASM,虽然它能防止基本的DoS攻击,但建议使用操作系统级别的进程隔离来获得强大的安全性。一个专门的工具`bash-tool`,针对AI代理的使用进行了优化。

## Just-Bash: 摘要 Vercel Labs 发布了“just-bash”,一个为 AI 代理设计的 bash 环境,允许它们执行命令。一个新的驱动程序可以连接一个与 S3 同步的完整 Archil 文件系统,提供高性能的数据访问,而无需完整的虚拟机。 讨论的中心在于 bash 是否是代理的*最佳*语言,考虑到它的年代和潜在的代码生成效率低下问题。建议使用替代方案,如 Python(使用受限制的版本,如 Pydantic 的 Monty)、Lua(特别是 Luau 用于沙盒化)和 TypeScript,尽管 bash 拥有大量的训练数据,这仍然是其继续使用的有力论据。 一个关键点是,LLM 似乎能够直观地理解 bash,而对于其他工具(如 Python)则不然,即使提供了明确的指令。人们对潜在的效率低下和安全漏洞表示担忧,一些人提倡使用沙盒虚拟机。还提到了几个相关项目,如 `openfs`(一个用于云存储的 bash 接口)和 `coral`(一个可移植的 shell 运行器)。最终,该项目旨在为代理提供一个可用的环境,即使这意味着接受与标准 bash 的一些不兼容性。

关于按住版权联系我们创作者广告开发者条款隐私政策和安全性YouTube的工作原理测试新功能© 2026 Google LLC

## XZ 后门事件概要 最近一次针对广泛使用的 XZ 数据压缩工具的复杂供应链攻击,几乎危及了许多 Linux 发行版。恶意行为者花费数月时间,巧妙地将后门注入 XZ 代码库中,旨在对使用受损库的系统进行潜在的远程代码执行。 此次攻击并非通过传统的安全审计发现,而是由一位微软员工在调试过程中注意到晦涩的性能问题,随后 Red Hat 的 valgrind 测试确认了这一点。后门隐藏在测试文件中,并通过修改后的构建脚本引入。 讨论强调了事件的严重性——可能赋予攻击者访问大量系统的权限——以及其被发现所涉及的难以置信的运气。该事件还引发了关于软件供应链安全、依赖项的作用(特别是通过 systemd)以及对基础开源项目增加审查和资金的需求的争论。虽然归因尚不确定,但猜测指向一个国家支持的行动者,可能来自俄罗斯,但证据尚无定论。该事件强调了持续存在的威胁形势以及勤奋的代码审查和健全的安全实践的重要性。

汉堡王正在推出“BK助手”,一个由OpenAI技术驱动的AI平台,旨在改善运营和客户服务。其核心是“Patty”,一个集成到员工耳机中的AI聊天机器人。Patty协助处理诸如订单准确性(例如,培根数量)和设备状态之类的任务,并即时更新所有订购平台上的库存信息。 然而,BK助手的功能超越了任务管理。它还会*评估*员工的“友好度”,通过识别“请”和“谢谢”等关键词,为管理者提供绩效数据作为辅导工具。 在探索AI得来速的同时,汉堡王正在谨慎推进,由于担心顾客的接受程度,目前在不到100家门店测试该技术。完整的BK助手平台计划于2026年底在美国全面推出,Patty目前正在500家餐厅进行试点。

## 汉堡王人工智能员工监控:摘要 汉堡王正在测试人工智能来监控员工与顾客的互动,具体检查他们是否使用了“请”和“谢谢”。 这建立在已有的AI得来速技术之上,该技术已被用于评估顾客情绪和追踪库存/清洁度,并曾因之前的安全漏洞而曝光。 此举引发了争论,许多人批评这是非人化的微观管理。 担忧集中在强迫礼貌而非培养真诚的客户服务,以及可能造成紧张的工作环境。 一些人认为雇主*应该*监控绩效,而另一些人则强调了权力失衡以及低收入工人难以找到替代就业机会的困境。 讨论还涉及人工智能在工作场所中的更广泛作用,引用了马歇尔·布雷恩的“曼纳”等反乌托邦场景,并质疑人工智能是否在解决真正的问题,还是仅仅在自动化不良管理实践。 许多评论员建议,关注公平工资和更好的工作条件,比人工智能驱动的礼貌强制执行更有效。

更多

联系我们 contact @ memedata.com