每日HackerNews RSS

## pgit:PostgreSQL 中的 Git 历史 pgit 是一款新的类 Git 命令行工具,直接将仓库数据存储在 PostgreSQL 数据库中,从而可以使用 SQL 强大的查询功能来查询提交历史。它建立在定制的增量压缩引擎 (pg-xpatch) 之上,pgit 通常比 `git gc --aggressive` 压缩仓库数据*更好*——在 20 个测试仓库(共 273,703 个提交)中,实现了 12 个仓库的压缩优势。 除了存储之外,pgit 还解锁了程序化分析。内置命令,如 `churn`、`coupling` 和 `hotspots`,可以提供有关代码库健康状况的见解,结果以 JSON 或交互式表格的形式提供。对于自定义分析,用户可以利用原始 SQL 查询整个历史记录。 一个关键的演示涉及一个 AI 代理,仅被提示分析 Neon 数据库仓库。在 10 分钟内,该代理成功导入了仓库,执行了 SQL 查询,并生成了一份全面的代码库健康状况报告,识别了关键文件和依赖项。 pgit 并非旨在取代 Git 用于日常开发,而是为了提供一个强大的平台来理解代码库历史,特别是用于自动化分析和 AI 驱动的洞察。该项目是开源的,欢迎贡献。

## Pgit:一个基于PostgreSQL的类Git命令行界面 一个名为Pgit的新项目提供了一个基于PostgreSQL数据库构建的类Git命令行界面。其核心思想是利用SQL的查询能力来处理Git历史记录,从而实现强大的分析并可能为AI代理解锁新的用例。 Pgit并非旨在*取代*Git,而是允许使用SQL查询提交历史,为复杂分析提供优势。初步测试表明,Pgit的数据压缩率与Git的激进压缩相当,但磁盘占用空间更大。 讨论中提到了与Fossil的比较,Fossil是一个类似的版本控制系统,基于SQLite构建。虽然考虑过SQLite,但PostgreSQL因其更好的并发写入处理能力以及对大型仓库(如Linux内核)的导入性能而被选中。一个关键优势是使代理能够直接使用SQL查询Git历史记录,提供它们原本无法获得的上下文。潜在的未来发展包括FUSE提供程序以加快CI/CD速度以及服务器端分支。

## 托尼·霍尔:优雅与影响的遗产 (1938-2024) 查尔斯·安东尼·理查德“托尼”·霍尔,计算机科学领域的一位杰出人物,上周逝世,享年92岁。他的贡献巨大,从广泛使用的快速排序算法——以其效率和优雅的简洁性而闻名——到开创性的公理语义学(“霍尔逻辑”)工作,彻底改变了程序验证。 尽管没有传统的博士学位,霍尔的影响力源于实践编程经验与古典训练的头脑的独特结合,以及以清晰和重点为优先的鲜明写作风格。他倡导一种严格的软件开发方法,影响了几代研究人员和从业者。 除了算法和逻辑之外,霍尔还通过他的通信顺序进程(CSP)对语言设计(影响Algol W并为Ada的并发机制做出贡献)和并发理论产生了重大影响。他始终致力于寻找统一的理论,并解决诸如经过验证的软件之类的重大挑战,在他职业生涯的整个过程中,在牛津大学和后来的微软研究院营造了一种协作的环境。 霍尔不仅是一位杰出的科学家,还是一位才华横溢的导师,激励了无数人。他的遗产不仅在于他的发明,还在于他对智力严谨性、持续学习以及对计算未来独特务实但雄心勃勃的愿景的奉献。

这个Hacker News讨论庆祝托尼·霍尔对计算机科学的影响,起因是他去世的消息。贡献者分享了从霍尔的工作中学习的个人经历,尤其是在牛津大学的1980年代和90年代,重点是像Z记号和CSP(通信顺序进程)这样的形式化规范语言。 对话强调了霍尔对并发和程序验证的影响,一些人回忆起他对Occam和Transputers的工作。一个关键点是霍尔后来对引入空引用概念的后悔,最初为了方便实现而添加,尽管它可能导致错误。参与者争论空指针是否本质上是必要的,并提到了像Rust这样的语言以及Lisp中NIL的历史背景。 该帖子还涉及Java等语言中并发的挑战,以及“契约”在软件设计中的重要性,这是霍尔帮助巩固的概念。总的来说,讨论将霍尔描绘成一个奠基人物,他的思想继续塑造着现代编程实践。

## 为屏幕设计的字体时代来临 几个世纪以来,排版主要关注印刷,屏幕字体仅仅是印刷字体的替代品。然而,随着屏幕阅读的增加,这种情况正在改变。微软认识到这种转变,并委托设计了六种新字体——Constantia、Cambria、Corbel、Candara、Calibri 和 Consolas,这些字体针对其 ClearType 渲染技术进行了优化,有望在未来十年内主导屏幕文本。 ClearType 利用次像素渲染来增强清晰度,克服了屏幕显示以前的限制。最新版本改进了平滑度和间距精度。这些新字体利用了 OpenType 字连,这是以前屏幕设计中不可用的功能,但缺乏多主控等高级技术。 这些字体优先考虑对比度,调整设计以克服抗锯齿造成的模糊效果。虽然 Constantia 在印刷和屏幕上都表现出色,Consolas 在编码方面是优秀的等宽字体,但其他字体如 Cambria 和 Candara 作为现有字体的替代品则不太吸引人。最终,微软的这套字体代表着朝着专门为数字阅读体验而设计的字体迈出的重要一步。

这次黑客新闻的讨论围绕着微软的ClearType字体渲染技术,该技术最初于2005年被评测。虽然当时受到赞扬,特别是对于Constantia和Consolas等字体,但评论员指出由于DirectWrite的采用,ClearType在现代微软应用程序中的表现有所下降——DirectWrite不支持ClearType,导致更简单的灰度像素抗锯齿。 一个关键的争论点集中在次像素渲染(如ClearType)及其与屏幕像素密度(PPI)增加的相关性。一些人认为更高的PPI使其变得不必要,因为人眼在分辨率方面存在极限,而另一些人则认为即使在超过100 PPI的情况下也能看到明显的改进,尤其是在近距离观看时。 用户还讨论了分辨率、GPU负载和电池寿命之间的权衡。许多人对无法轻松禁用次像素渲染(当它看起来不理想时)表示沮丧,并且有人指出MacOS已经完全移除了它。最后,一个相关的讨论涉及网站加载自定义字体时令人不快的“无样式文本闪烁” (FOUT) 问题。

## WCPU-1:从模拟到(令人谦卑的)现实 本文详细介绍了构建WCPU-1物理原型所遇到的挑战,WCPU-1是一款先前在Logisim-Evolution中模拟的自制8位计算机。尽管最初充满信心,但构建过程出乎意料地困难,充满了布线错误、组件故障和时序问题——与干净的模拟形成了鲜明对比。 该项目包括从PCBWay设计和订购定制PCB(包括EEPROM程序员、寄存器板和控制模块),以及面包板组件。问题包括发货错误的PCB、倒装的LED、浮动地址线和故障的EEPROM。一个关键的修复是通过时钟信号门控RAM写入来解决时序冲突。 尽管遭遇挫折,这台计算机*可以工作*——以1MHz的速度运行并执行测试程序。然而,它缺乏输出功能,并且依赖Arduino进行程序加载,这两点都有待改进。作者计划将设计整合到单个PCB上,解决剩余问题,并最终开始进行更高级的WCPU-2的工作,可能首先使用FPGA原型设计。整个项目将在整理好后在Github上开源。

威尔·沃伦详细介绍了他的自制CPU项目,相关文档在他的网站上。该项目目前处于第四阶段,涉及使用容易获得的元件在面包板上构建CPU——这是一个刻意的选择,旨在避免复杂的制造过程,并采用动手实践的方法。 讨论强调了使用分立元件构建的挑战,包括“中等集成度”IC的稀缺以及繁琐的接线工作。其他爱好者分享了技巧,例如使用两个’574芯片来实现闪烁灯和三态总线驱动,并回忆起类似的项目,回忆起计算机的早期时代,那时编程涉及手动开关、穿孔卡,甚至物理重新接线机器。 许多评论者赞赏其中付出的奉献和“第二种乐趣”,而另一些人则提倡使用模拟或基于FPGA的设计来避免实际障碍。该项目引发了关于CPU设计历史、微代码以及克服固有复杂性,将定制计算机变为现实的乐趣的对话。

启用 JavaScript 和 Cookie 以继续。

## 展示HN: 人生彩票 - 摘要 这个Hacker News讨论围绕一个模拟“人生彩票”的工具——根据种群数量随机分配你成为一个物种。初始帖子链接到一个类似的游戏 *RealLives*,强调了出生地对人生结果的巨大影响。 对话很快深入到哲学领域,质疑什么构成“你”,以及如何衡量存在的概率。一些人认为应该根据脑细胞或神经元数量来加权,认为我们的主观体验不仅仅是生物数量的问题。另一些人则认为我们都是单一意识的不同面向,通过不同的物理形式体验宇宙。 一个关键点是,考虑到存在着数量庞大的其他生命形式,成为人类的可能性有多小。这引发了对模拟理论的猜测——如果现实是模拟的,为什么我们的存在如此独特和脆弱?用户也指出了观察者偏差以及存在于能够支持生命的宇宙中的内在运气。 最后,许多用户测试了链接的模拟器,并注意到其随机性存在问题,经常落到“线虫”身上,因为它们的种群数量过于庞大。讨论还包括了模拟器使用的JSON数据,揭示了各种物种的种群数量。

## Ndea 正在招聘人工智能研究员/工程师 Ndea是一家远程优先的公司,正在寻找熟练的研究员和工程师来推进其在通用人工智能(AGI)系统方面的工作。重点是**搜索引导**——开发深度学习模型以提高结构化搜索过程的效率和可靠性。 这是一个高影响力的、实践性强的工作,涉及设计、实现和验证新颖的神经符号人工智能方法。Ndea 提供具有竞争力的薪酬待遇,包括有意义的股权、充足的计算资源以及协作的全球分布式团队。 理想的候选人将拥有强化学习或搜索引导方面的经验,并可能具备符号系统、逻辑编程或形式化方法方面的经验。要申请,请将您的所在地、作品展示、相关经验和个人资料链接发送至 [email protected]。 **推荐奖励:** 成功推荐一名被雇用的候选人,即可获得 10,000 美元奖励!

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Ndea (YC W26) 正在招聘符号化强化学习搜索引导负责人 (ndea.com) 1天前 | 隐藏 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## SCION:互联网安全的新基础 数十年以来,互联网的路由协议BGP由于缺乏内置安全机制,容易受到路由劫持和泄漏等攻击。像RPKI这样的补丁提供了一些有限的改进,但并未解决核心问题:BGP无法验证网络所有权。SCION由苏黎世联邦理工学院开发,提供了一种彻底的解决方案——完全重新设计互联网路由,而不是试图修复BGP的基础缺陷。 SCION利用多路径路由实现毫秒级故障切换,隔离域限制漏洞的影响,以及密码学路径验证以确保流量遵循约定的路由。这与BGP的单路径依赖和缺乏密码学安全形成了鲜明对比。 瑞士已成功部署SCION来支持其安全瑞士金融网络(SSFN),在替换一个20年的旧网络后,处理了超过2200亿美元的每日交易。尽管取得了成功,更广泛的采用仍然面临障碍:缺乏标准化,“先有鸡还是先有蛋”的初始部署问题、供应商集中(目前依赖Anapaya),以及现有系统*大致*可用时,证明基础设施更新的固有困难。 虽然SCION提供了一个更安全、更可控的互联网,但它的未来取决于重大的安全事件或对数字主权的推动是否会推动更广泛的采用。

## 瑞士开发的SCION:BGP的替代方案 一种新的网络协议SCION在瑞士开发,作为广泛使用的边界网关协议(BGP)的替代方案。该项目起源于苏黎世联邦理工学院(ETH Zürich)以外,尤其在瑞士金融领域获得了关注。 Hacker News上的讨论强调了瑞士大学在具有影响力的IT创新方面的集中度,并将其与麻省理工学院/美国模式进行比较。虽然SCION因其技术卓越而受到赞扬,但人们对其缺乏开放标准、IETF参与以及最初的专有/专利限制表示担忧——尽管现在GitHub上存在一个开源实现。 评论员们争论SCION的目标是*取代* BGP,还是提供一种根本不同的互联网架构。一些人认为其封闭性阻碍了更广泛的应用,并建议采取更开放的方式可以与思科或爱立信等行业巨头建立合作关系。另一些人指出,SCION并非设计用于简单地取代现有互联网上的BGP,而是提供了一种完整的替代方案。

启用 JavaScript 和 Cookie 以继续。

## JPEG 压缩:摘要 本文提供了对 JPEG 压缩的详细且视觉化的解释。它通过利用离散余弦变换 (DCT) 来识别和丢弃不太容易察觉的图像数据,从而分解了 JPEG 的工作原理,实现压缩。DCT 将图像数据转换为频率分量,从而可以去除高频细节(通常人眼无法察觉)。 文章强调,低质量 JPEG 中看到的“块状”伪影是由于数据不足以准确表示高频正弦波造成的直接结果。它还讨论了从 libjpeg v7 开始的现代 JPEG 实现如何使用基于 DCT 的色度缩放,这可能会引入细微的块状伪影。 除了核心压缩过程外,讨论还涉及了替代格式,如 JPEG 2000(使用离散小波变换)以及更新的选项,如 WebP 和 AVIF,并指出了它们的权衡。它强调,虽然较新的格式提供了改进,但 JPEG 仍然占据主导地位,因为它具有广泛的兼容性和“足够好”的性能。 最后,文章指出了 JPEG 设计背后的审美和工程选择,以及它如何从根本上基于人类感知的局限性。它还注意到,交互式网站可能会导致某些用户的高 CPU 使用率问题。

exe.dev 由于其固定费用订阅模式,可用 IPv4 地址数量有限,因此在为虚拟机提供 SSH 访问方面面临挑战。与使用“Host”标头在共享 IP 时将请求路由到正确服务器的 HTTPS 不同,SSH 缺乏等效机制。 为此,exe.dev 实施了一个系统,虚拟机共享一个公共 IPv4 地址池,但通过连接用户公钥*和*连接源 IP 地址的组合来唯一标识。这允许 SSH 代理将连接路由到正确的虚拟机。 这需要自定义管理软件来根据用户所有权分配 IP,并在使用 NAT 的云环境中准确确定原始 IP 地址。虽然这不是一个广泛适用的解决方案,但它使 exe.dev 能够为用户维护一致的、基于域名的 SSH 体验。

## 解密Countryle:一次地理推理之旅 受地理游戏(如GeoGuessr)和每日谜题(如Globle)的启发,作者尝试了Countryle——一个通过方向和统计线索(大陆、半球、人口、温度)来识别国家的游戏。他们并非简单地通过代码寻找答案,而是像玩家一样*解决*它,利用游戏的反馈。 解决方案的核心在于构建模块,根据每个线索过滤潜在的国家,然后使用香农熵对剩余候选国进行评分——优先选择能够最均匀地分割剩余可能性的猜测。有趣的是,当方向线索源自希腊时,由于地图投影(特别是墨卡托投影及其对感知距离的影响),它被证明具有特别的信息量。 模拟超过38,000场游戏显示,该求解器平均仅用2.85次猜测就能找到目标国家,这比仅仅依赖单个线索(如大陆)要好得多。虽然利比亚最初被认为是最佳起始国家,但进一步分析表明其他国家表现更稳定,突出了等权重熵方法的局限性。未来的改进包括完善线索权重和更细致地处理人口/温度范围。作者总结说,Countryle是一个探索信息论、搜索算法和地理表示概念的令人惊讶的丰富环境。

一位 Hacker News 用户 st0ffregen 对地理游戏 Countryle 进行了逆向工程,并运行了 38,612 次模拟,以确定最佳策略。通过分析熵和地理数据,他们确定了最佳起始国家,并创建了一个机器人,平均 2.85 次猜测就能解决游戏(最多五次)。 关键发现是,最有效的方法不是选择地理位置“有趣”的国家,而是选择能够最大化信息增益的国家——通常是位于中心地带、看似无趣的国家。这与对 Wordle 进行的类似分析相呼应,计算上的蛮力揭示了违反直觉的最佳策略。 这篇文章引发了关于可视化游戏可能状态以及是否可以进一步改进的讨论。

更多

联系我们 contact @ memedata.com