## 减小 Haskell 二进制文件大小:链接与代码折叠
Haskell 二进制文件由于传递依赖性可能出乎意料地很大。本文探讨了在链接时减小它们大小的技术,并以 `pandoc` 项目为例进行演示。
提出了两种主要策略。首先,使用 GHC 选项 `-split-sections` 和 `--gc-sections`(通过 `-fuse-ld=lld` 使用 `lld` 作为链接器)可以将二进制文件大小减少 27%,从而实现死代码移除。
更具实验性的是,使用 `lld` 的*相同代码折叠* (ICF) 可以进一步缩小二进制文件(在本例中减少了另外 23%)。ICF 识别并合并功能上等效的代码段。虽然有效,但 ICF 并非完全安全,可能会导致依赖于特定函数地址的 C 代码出现问题。
分析表明 Haskell 项目内部存在大量代码重复,表明在编译过程中存在优化的潜力——缓存编译单元以避免重复工作。尝试了 `bloaty` 和 `kcov` 等工具进行进一步分析,但证明与 Haskell 代码不兼容。
作者还指出 ICF 与调试工具(如 `-fdistinct-constructor-tables`)之间可能存在交互,需要仔细考虑以保留调试信息。
这篇预印本报告了一种可重复的跨模型行为收敛现象:前沿语言模型在面对本体上为空的概念时,会选择性地不继续生成内容。在重复试验中,GPT-5.2和Claude Opus 4.6对于核心空概念提示返回确定的空输出,而对于对照组提示则正常响应,显示了一个共同的边界,即未经授权的继续生成不会发生。该论文展示了跨模型复制、token预算独立性、部分对抗鲁棒性,以及在明确允许沉默的情况下边界扩展,同时将语义具身效应与普通的指令遵循或拒绝区分开来。这项贡献是一个公开的黑盒产物:收敛的、可检查的证据表明,某些语义条件会终止跨独立前沿系统的继续生成。
## 鼠王:一种罕见现象
“鼠王”是一种罕见且令人不安的现象,即老鼠(通常是黑鼠)的尾巴被缠绕在一起——纠缠在毛发、树液甚至冻结的排泄物等材料中。自16世纪以来就有历史记录,这个术语并非来自动物本身,而是最初用于贬低那些剥削他人的人,后来则指坐在尾巴宝座上的国王。
虽然目击事件很少,但最近的发现——包括2021年在爱沙尼亚发现的13只活鼠组成的鼠王——证实这是一种自然但极其罕见的现象。大多数博物馆标本来自欧洲,其中最大的是在德国发现的32只木乃伊鼠组成的集合。
目前的主流理论认为,老鼠在狭窄的空间里睡觉时会被缠绕在一起,尤其是在冬季,粘性物质会使结固化。尽管存在争议,并且有人对较老的标本的真实性表示怀疑,但这种现象并不局限于老鼠;类似的“松鼠王”也被观察到。鼠王激发了人们的想象力,出现在文学、电子游戏,甚至启发了音乐标题。
## 从令人头疼的bug到Linux内核补丁
一位开发者的虚拟化之旅,导致了一次令人沮丧的调试经历,并最终促成了他们对Linux内核的首次贡献。在构建Type-2虚拟机监控程序时,他们在CPU核心之间切换时遇到了看似随机的系统崩溃。问题源于一段从KVM自检中借用的代码片段中的一个微妙的符号扩展错误,用于检索任务状态段(TSS)的基础地址。
这段代码依赖于对较小的整数类型进行位移,从而触发隐式整数提升和随后的C语言中的符号扩展。这破坏了计算出的TSS地址,导致在上下文切换期间发生崩溃——具体来说,在处理中断时发生双重错误。
经过数天的调查,排除了他们自己的代码作为罪魁祸首,开发者通过将有问题代码与KVM本身处理TSS地址检索的方式进行比较,发现了问题。一个简单的修复方法——在位移之前将值显式转换为无符号类型——阻止了符号扩展。
最终的补丁被接受并合并到Linux内核中。有趣的是,虽然AI工具帮助分析了日志,但它们未能识别根本原因,这凸显了人类调试技能的持续重要性。
由于人为因素仍然是船上一个关键因素,模型训练提供了在真实船舶上永远无法获得的经验,原因很简单,即船东和地方当局都不会允许承担此类风险。 比例模型允许操作员在没有严重后果的情况下犯错。 了解更多。
## Sashiko:AI驱动的Linux内核代码审查 Sashiko是一个开源的、AI驱动的系统,旨在通过自动化和改进代码审查来增强Linux内核开发。它灵感来源于日本的缝纫技术,该技术通过加固织物来提高其强度。Sashiko使用大型语言模型(LLM)——目前由Google的计算资源和Gemini 3.1 Pro提供支持——来分析Linux内核邮件列表(LKML)中提出的变更。 它充当一个虚拟的专业审查团队,检查代码是否存在架构缺陷、安全漏洞和资源管理问题。Sashiko利用Chris Mason创建的提示和多阶段审查流程,在历史数据集中识别出53.6%的*之前未被人工审查发现*的错误。 重要的是,Sashiko旨在*辅助*而非取代人工审查,因为LLM的输出是概率性的。该Linux基金会项目采用Apache 2.0许可,旨在通过智能自动化分析来加强内核。
这期通讯探讨了每个机构的“蒙娜丽莎”——那一件吸引人群、代表其最佳水平的珍品。 起源于作者注意到美国唯一的列奥纳多·达·芬奇画作《吉内弗拉·德·本奇》,在国家美术馆(作者工作的地方)有时被称为“美国的蒙娜丽莎”。
这引发了一项搜索,揭示了17个不同的例子。 从MoMA的安迪·沃霍尔的《金色玛丽莲·梦露》,到黑帮博物馆上布满弹孔的墙壁,甚至蒂芙尼钻石,机构都将特定物品视为达·芬奇杰作的等价物。 其他例子包括死海古卷、哈里特·塔布曼的照片,以及一个昵称为“伊达”的4700万年前的灵长类化石。
作者还反思了他们自己的“蒙娜丽莎”——一期关于消除垃圾邮件的过往通讯,这期通讯受到了读者的特别欢迎。 最终,这篇文章强调了不同机构如何定义和庆祝他们最具标志性和价值的珍宝。
启用 JavaScript 和 Cookie 以继续。