## Fara-7B:一款紧凑且强大的计算机使用代理 Fara-7B 是微软首个旨在*使用*计算机的代理小语言模型(SLM),而不仅仅是生成文本。它仅有70亿参数,性能可与更大的模型相媲美,同时提供设备端部署、降低延迟和提高隐私等优势。 与传统的聊天模型不同,Fara-7B 使用鼠标和键盘与计算机交互,视觉感知网页并执行诸如点击和输入等操作——模拟人类交互。它在包含14.5万个基于网页的任务的合成数据集上进行训练,擅长自动化日常网络活动,例如购物、预订旅行和信息收集,完成任务的步骤比同类模型更少(约16步,而同类模型约为41步)。 Fara-7B 在 WebVoyager 和名为 WebTailBench 的新基准测试等网络代理基准测试中取得了最先进的成果,证明了其在各种任务中的有效性。它可通过 GitHub 进行本地使用,也可以部署在 Azure Foundry 上以便于访问,或者在有 GPU 资源的情况下使用 VLLM 自行托管。微软鼓励社区探索和反馈,建议在沙盒环境中进行初步测试。
## LLM驱动的文件系统:摘要
该项目探索使用语言模型(LLM)来实现文件系统,源于作者对LLM能力以及压缩与人工智能之间联系的好奇。核心思想是训练LLM基于FUSE操作(如读取、写入、删除)来预测文件系统状态。
创建了一个环回FUSE文件系统来记录操作并生成训练数据,数据以XML格式表示。在这些数据上微调Qwen3-4b模型,实现了约98%的预测文件系统变化准确率。这使得构建一个功能性的FUSE文件系统成为可能,其中*每个*操作都通过查询LLM来处理。
关键见解出现在应用算术编码——一种可逆压缩技术——到XML文件系统表示时。微调后的LLM表现出卓越的自压缩能力,压缩率比传统的squashfs等工具高出高达8倍。这突显了LLM如何利用学习到的模式来高效地表示数据,特别是基于文本的结构,如文件系统元数据。
虽然目前是一个带有局限性的“玩具”实验(LLM依赖性、上下文窗口大小),但结果表明LLM压缩在未来可能具有优势,尤其是在边缘计算或不频繁数据访问场景中。该项目的源代码已开源,供进一步探索。
欧盟理事会就备受争议的儿童性虐待监管条例(CSAR),通常被称为“聊天控制”,达成了一项期待已久的协议。经过三年多的辩论,该法案尽管存在重大的隐私问题,仍获得通过。
争议的核心在于规定要求消息服务——即使是端到端加密的服务——扫描儿童性虐待内容(CSAM)。尽管最新版本使这种扫描成为*自愿的*,但隐私专家仍然深感担忧,认为存在侵犯基本权利和破坏强加密的风险。
该条例还为在线服务引入了风险等级,可能会迫使高风险平台为风险缓解技术做出贡献。一个新的欧盟机构将负责监督实施。
尽管丹麦司法部长保证将打击虐待行为,但批评人士认为该协议为加强监控铺平了道路。理事会现在将与欧洲议会进入谈判,以最终确定该条例,面临着在保护儿童与数字隐私之间取得平衡的挑战。