每日HackerNews RSS

## Fara-7B:一款紧凑且强大的计算机使用代理 Fara-7B 是微软首个旨在*使用*计算机的代理小语言模型(SLM),而不仅仅是生成文本。它仅有70亿参数,性能可与更大的模型相媲美,同时提供设备端部署、降低延迟和提高隐私等优势。 与传统的聊天模型不同,Fara-7B 使用鼠标和键盘与计算机交互,视觉感知网页并执行诸如点击和输入等操作——模拟人类交互。它在包含14.5万个基于网页的任务的合成数据集上进行训练,擅长自动化日常网络活动,例如购物、预订旅行和信息收集,完成任务的步骤比同类模型更少(约16步,而同类模型约为41步)。 Fara-7B 在 WebVoyager 和名为 WebTailBench 的新基准测试等网络代理基准测试中取得了最先进的成果,证明了其在各种任务中的有效性。它可通过 GitHub 进行本地使用,也可以部署在 Azure Foundry 上以便于访问,或者在有 GPU 资源的情况下使用 VLLM 自行托管。微软鼓励社区探索和反馈,建议在沙盒环境中进行初步测试。

2015-06-16T13:12:39-05:00 Canon iR-ADV C7055 2015-06-17T10:08:26-04:00 2015-06-17T10:08:26-04:00 Adobe PSL 1.1e for Canon application/pdf uuid:b1678055-0000-001e-8f33-335e00000000 uuid:11c6e885-f13b-4367-84c9-10287f30f24a HyTSw oɞc [5laQIBHADED2mtFOE.c}08׎8GNg9w߽

这个Hacker News讨论围绕着1986年的一份PDF文件,标题为“音频活性衰变的奇妙化学”。用户们回忆起发现这篇论文并探索其中的数学概念,特别是不同编号基数的变化。 讨论的关键点是数学方法中出现的数字92,以及它与元素周期表中92种元素的奇妙联系。一位用户澄清这并非直接对应,因为地球上只有83种稳定的元素,或者如果包括持续衰变产生的元素,则为90种。然而,潜在的新碱土金属(ununennium和unbinilium)的发现可能会使数量达到92。 对话还涉及Conway的“看与说”数字,以及Numberphile视频声称其与元素周期表无关,一些人对此表示怀疑。分享了与自动机理论和Haskell实现分析该序列相关的研究链接。

## LLM驱动的文件系统:摘要 该项目探索使用语言模型(LLM)来实现文件系统,源于作者对LLM能力以及压缩与人工智能之间联系的好奇。核心思想是训练LLM基于FUSE操作(如读取、写入、删除)来预测文件系统状态。 创建了一个环回FUSE文件系统来记录操作并生成训练数据,数据以XML格式表示。在这些数据上微调Qwen3-4b模型,实现了约98%的预测文件系统变化准确率。这使得构建一个功能性的FUSE文件系统成为可能,其中*每个*操作都通过查询LLM来处理。 关键见解出现在应用算术编码——一种可逆压缩技术——到XML文件系统表示时。微调后的LLM表现出卓越的自压缩能力,压缩率比传统的squashfs等工具高出高达8倍。这突显了LLM如何利用学习到的模式来高效地表示数据,特别是基于文本的结构,如文件系统元数据。 虽然目前是一个带有局限性的“玩具”实验(LLM依赖性、上下文窗口大小),但结果表明LLM压缩在未来可能具有优势,尤其是在边缘计算或不频繁数据访问场景中。该项目的源代码已开源,供进一步探索。

## LLM 与数据压缩:一种新方法 最近 Hacker News 的讨论集中在大型语言模型 (LLM) 作为数据压缩工具的惊人有效性上,尤其是在 enwik8 和 enwik9 等基准数据集上。最初的说法表明 LLM 实现了最先进的压缩效果,甚至超越了传统算法。 然而,关于公平比较的争论浮出水面。人们担心基于 LLM 的压缩是否准确地考虑了模型本身的大小(解压缩器)——这是 Hutter Prize 等基准测试中的一个关键因素。虽然一些 LLM 显示出潜力,特别是 Fabrice Bellard 的 `nncp`,但其他 LLM 在包含解压缩器大小时并没有优于既定方法。 这场讨论凸显了将 LLM 应用于压缩的挑战,包括上下文窗口大小的限制以及主要适用于文本数据的局限性。尽管存在这些限制,这个想法仍然引起了很多人的共鸣,并激励人们进一步探索使用 LLM 进行文件系统级别的压缩——这是某些系统工程师长期以来的雄心。

欧盟理事会就备受争议的儿童性虐待监管条例(CSAR),通常被称为“聊天控制”,达成了一项期待已久的协议。经过三年多的辩论,该法案尽管存在重大的隐私问题,仍获得通过。 争议的核心在于规定要求消息服务——即使是端到端加密的服务——扫描儿童性虐待内容(CSAM)。尽管最新版本使这种扫描成为*自愿的*,但隐私专家仍然深感担忧,认为存在侵犯基本权利和破坏强加密的风险。 该条例还为在线服务引入了风险等级,可能会迫使高风险平台为风险缓解技术做出贡献。一个新的欧盟机构将负责监督实施。 尽管丹麦司法部长保证将打击虐待行为,但批评人士认为该协议为加强监控铺平了道路。理事会现在将与欧洲议会进入谈判,以最终确定该条例,面临着在保护儿童与数字隐私之间取得平衡的挑战。

谷歌最近在Pixel 10上增加的类似AirDrop的功能,名为“快速分享”,并非变通方案,而是欧盟新法规的直接结果。《数字市场法案》(DMA) 迫使苹果采用可互操作的无线标准,特别是Wi-Fi Aware,用于文件共享——这是该公司放弃为其AirDrop提供动力的专有系统的举措。 这一旨在提高竞争力的改变,无意中为Android设备利用相同技术打开了大门。虽然谷歌并未与苹果直接合作,但DMA的要求在不损害安全性的前提下,实现了“快速分享”的功能。 然而,苹果正在积极寻求废除DMA,欧盟也在重新考虑其对科技监管的方法,这意味着Pixel 10用户之间的跨平台能力并非长期保证。 这项优势源于监管压力,不一定预示着未来科技巨头之间的合作。

这次Hacker News讨论围绕着一篇关于Google Pixel 8可能支持AirDrop的提交,很可能受到欧盟《数字市场法案》(DMA)的影响。最初的帖子被标记为重复,引发了用户之间的争论。 争论的核心在于什么构成“重复”讨论。一些用户认为标记过于严格,扼杀了新的讨论,尤其是当之前的讨论已经过去几天了。另一些人,包括像“tomhow”这样的版主,则为这种做法辩护,解释说应该将相同的话题合并,*除非*有新的信息或分析。 在这种情况下,虽然文章本身不是新的(来自Ars Technica的转载),但一些人认为DMA的背景值得进行新的讨论。最终,这次对话凸显了在像Hacker News这样大型在线论坛中管理重复话题和促进有效讨论的挑战。还提供了一个指向更广泛讨论线程的链接。

台湾正体现了一种日益增长的趋势:企业通过提供小额奖励来积极推广应用程序下载。然而,交出你的手机或下载这些应用程序,除了恼人的广告外,还存在重大风险。 作者警告了“监控资本主义”,在这种模式下,公司收集数据以实施“监控定价”——根据个人 perceived 的财务状况收取不同的费用。这会将权力从市场转移到公司手中,由公司决定商品价值,而不是稳定的经济。 同样令人担忧的是,应用程序服务条款中隐藏着“绑定仲裁”条款。这些条款迫使用户进入私下、公司控制的争议解决程序,绕过法院系统,并可能剥夺法律权利——正如迪士尼与一起意外死亡索赔案件中所悲剧性地说明的那样。 作者预测这种趋势将会恶化,扩展到自动驾驶汽车、智能设备,甚至新闻订阅等场景。核心建议是:**不要下载该应用程序。** 通过抵制这些压力来保护你的数据和权利。

可能因为我的眼睛老了,或者是因为macOS窗口的对比度越来越差。无论如何,我昨晚制作了一个小型的Mac应用,它会在活动窗口周围绘制边框。我把它命名为“Alan”。在Alan的偏好设置中,你可以选择首选的边框宽度以及亮色和暗色模式下的颜色。就这些了。这就是这个应用。你可以在这里下载经过公证的Alan副本。这里有一个简短的演示视频。如果你想隐藏Alan在Dock中的图标,你可以运行这个终端命令来设置一个隐藏的偏好设置。然后,重新启动应用。`defaults write studio.retina.Alan hideDock -bool true`

## Alan.app 与 macOS 窗口可见性 – Hacker News 摘要 一款名为 [Alan.app](https://tyler.io/) 的新应用旨在解决 macOS UI 长期存在的问题:难以区分重叠的窗口。该应用为活动窗口添加边框,提高清晰度——由于苹果在 UI/UX 设计选择上优先考虑美观而非功能性,用户自 macOS Tahoe 以来一直面临这个问题。 讨论强调了苹果从可用性向视觉吸引力转变,并提到了过去的可访问性专家以及 Don Norman 在 2015 年的批评。 许多评论者推荐 [HazeOver](https://hazeover.com/) 作为替代方案,它会调暗除活动窗口外的所有窗口。 该应用利用辅助功能 API 和透明窗口来实现其效果,但一些用户报告称在 M1 Mac 上存在明显的延迟。 开发者确认这种方法优先考虑在 macOS 更新中的稳定性。 许多人对该功能未内置感到沮丧,一些人使用 Hammerspoon 脚本来实现类似的结果。 据推测,该应用的名称是对 Steve Coogan 的角色 Alan Partridge 的致敬。

## Safe-npm:保护您的项目免受供应链攻击 Safe-npm 是一款注重安全的 npm 安装器,旨在缓解 npm 包被破坏日益增长的威胁。它的工作原理是**仅安装已公开存在至少一定时间(默认 90 天)的软件包版本**,从而为安全社区提供时间来识别和报告恶意发布。 当您运行 `safe-npm install` 时,它会检查 npm 注册表,根据您指定的年龄阈值*和*语义版本控制 (semver) 要求过滤版本,然后安装最新的安全版本。您可以使用 `--min-age-days` 自定义最小年龄,并使用 `--ignore` 绕过对受信任软件包的年龄检查。`--strict` 标志可确保如果找不到安全版本,构建将失败。 **主要功能包括:** 模拟运行模式以预览更改、控制仅安装 `devDependencies` 或 `productionDependencies`,以及安装策略选项。 虽然 Safe-npm 并非万无一失的解决方案,但它为防御突发的供应链破坏增加了一层重要的保障,用牺牲对最新功能的即时访问来换取更高的安全性。最好将其与其他安全实践(如定期审计和依赖项审查)一起使用。

## Safe-NPM:供应链安全工具 最近的 npm 供应链攻击(如 Shai-Hulud 和 Chalk/debug 漏洞)促使开发了 **Safe-NPM**,这是一款 CLI 工具,旨在通过仅安装至少发布 90 天的软件包来降低风险。由 kevinslin 开发,它查询 npm 注册表,过滤掉最近发布的版本,并安装与指定语义化版本范围匹配的最新“旧”软件包。 虽然这并非万无一失的解决方案——它无法捕获最初的恶意软件包或控制传递依赖(尽管计划提供覆盖功能),但它旨在提供针对*最近*漏洞的“80/20”防御。 该工具引发了讨论,一些人指出 `pnpm` 和 npm 的 `--before` 标志中已有的功能,另一些人强调依赖项固定和定期、经过审计的更新的重要性。人们担心延迟访问补丁,并且如果大家都采用这种方法,可能会阻碍漏洞发现。最终,Safe-NPM 被呈现为一种降低风险的策略,而不是安全保障。 [https://github.com/kevinslin/safe-npm](https://github.com/kevinslin/safe-npm)

## 电影的失落艺术? 最近重温了《沉默的羔羊》,引发了对现代电影制作似乎日渐衰落的思考。作者认为,80年代和90年代的经典电影,如《好家伙》和《低俗小说》,拥有当代电影中常常缺失的深度和真实性。 这些老电影优先考虑角色发展、有影响力的叙事和风格上的冒险——信任观众能够参与到复杂的故事中。例如,斯科塞斯和塔伦蒂诺被赋予了创作自由,从而创作出具有持久影响力的电影。 相比之下,像《子弹列车》和《窗边的女人》这样的现代电影常常显得是人为制造的,优先考虑风格而非实质,依赖于视觉奇观而非真挚的情感联系。焦点已经从艺术视野转移到算法优化和系列电影潜力,最终导致娱乐性迅速被遗忘。虽然技术已经进步,但真正*打动*观众的能力似乎已经减弱,在观看电影和真正*体验*电影之间留下了一个空虚。

## 为什么90年代的电影感觉不同——黑客新闻讨论总结 最近黑客新闻上的一场讨论集中在为什么90年代的电影通常比当代电影,特别是像Netflix这样的流媒体服务上的电影,感觉更引人入胜和“鲜活”。核心观点是,现代电影通常被设计成在观众分心(例如使用手机)时被动消费,依赖于明确的解释和更简单的叙事。相反,90年代的电影信任观众会注意并推断意义。 讨论中提出了一些观点:现在内容的数量过多使得找到高质量的电影更难;影棚优先考虑特许经营潜力以及大众吸引力,而不是艺术风险;相机技术的进步改变了视觉风格,有时牺牲了氛围。其他人注意到注意力持续时间缩短,以及由于简单的CGI和像漫威这样互联宇宙的统治,导致了对视觉奇观而非实质内容的转变。 许多评论者同意,虽然并非*所有*现代电影都很肤浅,但激励结构通常倾向于易于理解的内容。此外,人们也认识到记忆偏差和幸存者偏差——我们记得过去最好的电影,而很多现代内容却容易被遗忘。最终,这场讨论强调了当代电影制作中 perceived 的细微差别、冒险精神和艺术完整性的丧失。

更多

联系我们 contact @ memedata.com