Selector Forge 是一款由人工智能驱动的浏览器扩展程序(支持 Chrome/Firefox),旨在为网页自动化、测试和抓取生成稳健可靠的 CSS 和 XPath 选择器。 与标准工具不同,它采用迭代循环机制:你在实时页面上选择元素,AI 会提出候选选择器,扩展程序随后立即根据实际 DOM 进行验证。如果选择器无法正确解析,它将被舍弃,从而确保由浏览器——而非 AI——充当“事实来源”。 **主要功能包括:** * **选择模式:** 可选择单个元素,或通过选取两个示例来识别重复列表。 * **验证机制:** 仅向用户呈现经过重新验证且功能完备的选择器。 * **优化调整:** 包含深度查找模式,以调整 DOM 上下文和精确度。 * **开发者友好:** 基于 WXT 和 React 构建,项目包含全面的测试套件(Vitest/Playwright),并支持通过 Ladle 进行组件预览。 虽然目前该项目集成了 Intuned 的后端,但计划提供可自托管的开源替代方案。它旨在与 Intuned CLI 和自动化生态系统集成,是防止端到端测试和自动化项目中出现脆弱选择器问题的强大工具。
© Valve Corporation. 保留所有权利。所有商标均为其在美国及其他国家的各自所有者所有。隐私政策 | 法律声明 | 无障碍访问 | Steam 订户协议 | 退款 | Cookie
为了确定他的灵缇犬最喜欢的零食,亚当·韦斯皮瑟(Adam Wespiser)使用**布拉德利-特里模型(Bradley-Terry model)**进行了一项对照实验。这是一种基于两两比较建立全球排名的统计方法,其逻辑类似于国际象棋等级分(Elo ratings)和聊天机器人竞技场(Chatbot Arena)。
每晚,韦斯皮瑟都会给比波普(Bebop)提供两种不同的零食,让它选择其中一个。数据揭示了轻微的选择偏好(可能是由于厨房布局造成的),分析中已对此进行了修正。在进行了多次试验并使用自助重采样(bootstrap resampling)确保准确性后,韦斯皮瑟确定了一个清晰的等级序列。
**Pur Luv Chicken** 最终脱颖而出,成为目前的冠军,表现优于 Greenies 和 Pork Chomps 等其他选项。虽然零食 E 是明显的领先者,但另一个表现强劲的竞争者(零食 A)与它的差距非常小,导致最终排名尚未完全定论。因此,韦斯皮瑟计划继续进行实验,重点针对前两名进行一对一测试,以最终确定排名。
本文认为,提示词注入及更广泛的大型语言模型(LLM)漏洞,其根源在于“角色混淆”。虽然 LLM 使用标签(如 `user`、`assistant`、`tool`)来构建输入结构,但这仅仅是连续文本流上的标记。在内部,模型并不会严格执行这些边界;相反,它们通过写作风格或措辞等“不安全”特征来推断角色。
作者证明,当注入的文本模仿高权限角色(如“推理” `think` 或合法的 `user` 指令)的风格时,无论官方标签如何,模型的内部表征都会发生转变以反映该角色。这就解释了为何静态安全基准测试往往失效:它们测试的是已知的攻击字符串,而人类攻击者可以自适应地改写提示词,从而触发这种底层的角色感知缺陷。
研究人员引入了“角色探测”(role probes)来衡量这种混淆,结果表明模型可能被诱导将恶意数据视为其自身的私密想法(思维链伪造)或权威指令。他们总结道,由于角色是管理 LLM 内部竞争目标的主要机制,因此该缺陷具有系统性。他们呼吁转向“真正的角色感知”,并深入科学地研究角色作为现代人工智能关键认知基础设施的作用。
这份摘要涉及 *Sokolskyfilm, Inc. v. Lauren Messiah Inc.* 一案,诉讼内容为一名博主在 2009 年的博文中使用了 1962 年的“帕克火车照片”(Parker Train Photo)。尽管该照片在其网站上已存在十余年,摄影师仍于 2025 年提起诉讼。
法院作出支持被告的简易判决,理由是采用了“有利于被告”的合理使用原则。尽管被告使用了照片的 100% 内容,且博文具有商业背景,但法院认为该使用方式具有转化性,因为它伴随着时尚建议;此外,法院还认定该使用未造成市场损害,因为原告的目标市场是艺术品市场。法院同时驳回了根据第 1202 条提出的索赔,认为没有证据表明被告有隐瞒作者身份的意图。
本报告作者强调,在联邦法院对如此低风险、陈旧的博文进行诉讼是荒谬的。此案体现了在线版权法中诉讼时效的“死亡”,即每一次浏览都可能导致时效重置。归根结底,该判决反映了司法界希望处理琐碎、陈旧侵权索赔的愿望,尽管这与认定全文使用照片即构成侵权的其他裁决存在不一致之处。