## 幽灵二进制依赖:日益增长的威胁 在2026年的FOSDEM上的一次演讲强调了“幽灵二进制依赖”这一关键问题——依赖于其他包的预编译代码(二进制文件),但这些依赖关系并未在项目清单中明确记录。这种隐藏的依赖关系对软件的可持续性和安全性构成风险。 目前,包管理器会跟踪源代码依赖关系,但通常会忽略这些二进制链接,这在像Python这样的语言调用编译代码(如C)时经常发生。如果没有识别这些依赖关系,就无法通过像开源承诺这样的倡议来支持原始开发者,从而威胁到开源生态系统的长期健康。 更重要的是,未记录的二进制依赖关系会产生安全漏洞。如果所依赖的二进制文件存在缺陷,项目会不知不觉地面临风险,可能影响到医院和互联网等关键基础设施。 提出的解决方案包括开发工具来识别和记录这些二进制依赖关系,为改进的安全警告和维护者的可持续资助模式铺平道路。多个项目和提案(如Python中的PEP 770和804)已经在进行中,以应对这一挑战,旨在提高软件供应链的透明度。
这篇博文讲述了看似小众的数据结构——跳表——如何意外地解决了软件测试公司 Antithesis 的一个重大性能问题。作者最初认为跳表过于复杂,但当在分析软件模糊测试产生的大型数据集时,在 Google BigQuery 中遇到查询速度慢的问题时,重新发现了它的用处。
Antithesis 需要有效地追踪导致特定日志消息的事件历史,这需要遍历分支树结构。BigQuery 的架构针对全表扫描进行了优化,难以处理树遍历所需的众多点查询。为了避免使用分数据库方法带来的复杂数据库一致性问题,团队创新了一种“跳树”——本质上是多个共享结构的跳表——并使用 SQL 表实现。
这使得通过链式 JOIN 进行祖先查找成为可能,巧妙地平衡了查询复杂度和 BigQuery 的定价模式。虽然生成的 SQL 代码很长,但 JavaScript 编译器可以自动生成它。跳树解决方案有效运行了六年,直到 Antithesis 开发了自己的优化数据库。作者总结说,即使是晦涩的数据结构也可能证明非常有价值,并强调了创新的周期性——跳树概念与现有的“跳图”结构相关。
这篇帖子剖析了一种有趣的动态,即我们如何解读媒体,灵感来源于重读《糊涂蛋日记》。作者认为,它的幽默之处在于格雷格·赫夫利在日记里*说*的话和他行为(通过附带的涂鸦展示)所揭示的真实性格之间的差距。关键在于,插图表明格雷格*知道*自己的缺点,这与一种常见的解读——将他描绘成无知的——相矛盾。
这个观察结果可以延伸到现实生活中那些广受批评的在线“主角”——那些个人写作被广泛评论的人。作者指出,人们倾向于指责这些作者缺乏自我意识,但他们的写作往往*有意*呈现一幅不讨喜的自我画像。以丹尼尔·奥本海默的《纽约时报》文章为例,帖子认为,批评这种写作的*内容*是合理的,但假设作者不知道他们所造成的印象是不准确的。
最终,作者提倡更细致的批评,关注*所说/所做*的内容,而不是错误地将无知归于作者。他们俏皮地提出需要一个术语来描述这种现象——文本与创作者意识之间的脱节。