每日HackerNews RSS

本摘要概述了基于 Hironobu Suzuki 文档的 PostgreSQL 内部机制研究要点。 **逻辑与物理结构** PostgreSQL 集群是管理多个数据库的单一实例,每个数据库均由 OID 标识。在内部,数据库、表和索引作为文件存储在数据目录(`$PGDATA`)中。尽管对象由 OID 标识,但其物理存储位置是通过 `relfilenode` 进行管理的。当表被重写(例如通过 `VACUUM FULL`)时,其 `relfilenode` 会发生变化,但 OID 保持不变。PostgreSQL 还支持**表空间(Tablespaces)**,允许通过符号链接将数据存储在特定的外部目录中。 **存储与数据访问** PostgreSQL 将数据组织为 8KB 的页面。每个页面包含一个页头、指向元组的行指针以及实际的堆数据。 * **TOAST(超大属性存储技术):** 当数值超过 2KB 时,PostgreSQL 会自动将其移动到独立的“TOAST”表中,仅在主行中保留一个指针。 * **读/写操作:** 写入操作将数据追加到页面中,指针从前向后增长,而元组则从后向前排列。读取操作通过顺序扫描(Sequential Scans)执行,或利用 B 树索引通过其 `ctid`(页面号与偏移量)定位特定的元组。

抱歉。

齿轮无处不在。时钟、汽车、自行车,甚至你的打印机里都有数不尽的齿轮!在本次分析中,我们将重点关注齿轮的两个特性:倍增扭矩和改变速度。为什么扭矩在这里很重要?给这个玩具的发条上弦需要很大的扭矩。但这是一款儿童产品,我们该如何让孩子操作起来更轻松呢?答案就是齿轮!齿轮为孩子们提供了机械优势。现在,孩子们只需施加适度的力,就能上紧坚硬的发条。

这篇 Hacker News 帖子讨论了一次关于回力玩具车的详细拆解。讨论中充满了怀旧色彩,用户们回忆起童年玩这些玩具的经历,以及因过度拧发条而产生的“咔哒”声——这被揭示是一种内置的应力释放机制。 除了玩具车,讨论还转向了诸如自动注射器(如 EpiPen 或 GLP-1 注射笔)这类工程奇迹的复杂内部机制。用户对这些一次性塑料装置如何在完美的时机下完成插入针头、注入药物和针头回缩这三个连续动作表示惊叹。Steve Mould 的科普视频经常被引用为理解这些复杂的弹簧驱动系统的首选资源。 其他评论探讨了摩擦动力马达的历史、与复古 Darda 赛车的对比,以及关于玩具车设计中特定齿轮功能的疑问。总的来说,这篇帖子体现了人们对日常生活中“隐藏”机械工程的共同欣赏,从简单的童年玩具到救命的医疗设备,无所不包。

**Webernetes** 是一个基于 TypeScript 的 Kubernetes 部分移植版本,旨在完全运行于浏览器中。该项目历时两个月,耗费约 10 万行代码构建而成,模拟了 Kubernetes 的核心功能(包括 Pod 生命周期、集群 DNS、网络连接和控制器),且无需将 Go 语言编译为 WebAssembly。 与标准的 Kubernetes 不同,Webernetes 不从外部仓库拉取镜像,而是使用自定义的浏览器端仓库以及用于定义镜像和管理工作负载的 TypeScript API。虽然目前尚不支持持久卷(Persistent Volumes)和密钥(Secrets)等功能,但该项目的定位是作为创建交互式教学内容的工具,而非生产环境发行版。 该项目在很大程度上借助了大型语言模型(LLM)完成。为确保代码质量并防止生成“垃圾代码”,作者手动审查了每一行代码,并实施了严格的测试套件,包括在浏览器环境和真实 k3s 集群中运行的 204 项集成测试。这种方法使作者能够在 AI 生成的速度与人工监督的精确性之间取得平衡。该项目现已开源,是一个利用 AI 辅助编码构建复杂、高保真技术系统的独特案例研究。

游戏开发者 Glenn Fiedler 指出了多人游戏领域的一个变革性转变:Amazon GameLift 宣布,第六代及以上实例将不再收取出口带宽费用。 对于开发者,尤其是那些开发高带宽、高玩家数量游戏的开发者而言,出口带宽成本历来是一笔高昂的负担。通过取消这些费用,AWS 正在推动云托管服务的普及,使独立开发者能够与大型工作室同台竞争,而无需承担巨额的带宽账单。 Fiedler 预测,此举将在未来五年内对行业产生深远影响: * **市场转型:** 多人游戏将大量迁移至 AWS,给裸机托管服务商带来巨大压力。 * **竞争格局:** 谷歌等竞争对手将被迫跟进这一举措,否则将面临退出市场的风险。 * **技术创新:** 带宽限制的消除将开启高保真、高玩家数量游戏的新时代。 归根结底,Fiedler 将此视为行业的一个里程碑时刻。他预测,摆脱“90 年代式”的带宽限制,将使开发者能够创造出比以往任何时候都更详尽、更具沉浸感且更具盈利能力的多人游戏体验。

这篇 Hacker News 帖子围绕现代多人游戏网络技术的争论展开。原作者是一位专业游戏开发者,他认为 AWS 等服务商提供的免费流出带宽,使开发者能够通过利用状态同步(而非局限的基于输入同步的联网方式)来支持规模大得多的玩家数量(例如 1,000 人)。 帖子中的批评者对此表示质疑,称每个客户端 10–20 Mbps 的带宽占用“荒谬”,并认为这可能是网络代码架构拙劣的标志。他们主张高性能游戏应当能在占用极少数据的情况下运行,并对客户端性能瓶颈以及过度依赖专有云服务商带来的风险表达了担忧。 作者则辩解称,与传统 32 人游戏不同,扩展至 1,000 名玩家会呈指数级增加状态更新需求。他指出,随着互联网基础设施的改善和带宽成本的下降,开发者不再被迫受限于世纪之交的网络技术约束。归根结底,这场讨论凸显了传统网络限制与一种新路径之间的分歧:后者通过牺牲带宽以换取在大规模、非确定性多人环境下的更高可扩展性和拟真度。

《类型系统中的反例》(*Counterexamples in Type Systems*)由 Stephen Dolan 整理,Andrej Bauer、Leo White 和 Jeremy Yallop 参与编写,是一份详细记录编程语言类型系统中常见陷阱、悖论和边缘情况的综合目录。 该合集探讨了 31 个不同的技术挑战,揭示了类型理论实现中的缺陷或复杂性。核心议题包括与可变状态相关的风险(多态引用和可变匹配)、型变与子类型的细微差别,以及由重载、递归和面向对象私有性等高级特性引发的复杂问题。通过记录诸如“作用域逃逸”、“柯里悖论”和“运行时类型误导”等问题,该索引成为了语言设计者和研究人员的重要资源。它强调了看似直观的类型规则在组合使用时如何导致不稳健、不稳定或意外的行为,为形式化类型理论与实际应用相结合的边界提供了一份严谨的审视。

受 Jeff Geerling 的 10 英寸迷你机架系列启发,作者使用 20 毫米铝型材定制了一个机架,用于收纳六台 1L 虚拟化主机。为了寻找比预制套件更具性价比、比 3D 打印支架更耐用的方案,作者选择了定制切割的铝板。 该机架采用开放式设计以利于通风,通过 USB 转风扇接头适配器进行散热管理,并结合了铝材和木质面板。网络方面由两台交换机负责,其中包括一台 26 年历史的复古 3Com 设备,并支持用于虚拟机迁移的 2.5GbE 后端网络。 尽管该项目成功整理了作者的书桌,但也面临了一些挑战:笨重的电源适配器管理、狭小的布线空间以及有限的端口访问权限。最终造价约为 313 欧元(不含风扇)。虽然与市售方案相比,该项目在资金上并未显著节省,但它提供了一个功能齐全、自给自足且令人满意的虚拟化实验室。作者通过 Zigbee 电源适配器和网络唤醒(Wake-on-LAN)来管理机架约 90W 的待机功耗。尽管布线复杂,但从功能实现的角度来看,该项目取得了成功。

近期一篇 Hacker News 的讨论展示了一位用户利用 T 型槽铝型材自制的 10 英寸“迷你机架”。该项目引发了极大兴趣,突显了 T 型槽框架(常被称为“80/20”)在构建耐用且模块化家庭实验室方面的实用性。 讨论涵盖了几个核心主题: * **材料与采购:** 用户建议北美地区用户使用 McMaster-Carr,欧洲用户可选择 Motedis。另有用户指出,受 3D 打印行业推动,型材价格正趋于亲民。 * **电源困境:** 一个反复出现的痛点是如何管理多个独立的电源适配器。建议包括使用带有转接板的 ATX 电源、明纬(Meanwell)电源单元,或使用专门的 DC-DC 转换器来取代笨重的适配器。 * **替代方案:** 评论区讨论了自制方案与预制解决方案(如宜家家具改造,例如 Helmer 储物柜)或标准 10 英寸机架外壳之间的优劣。 * **设计与标准:** 关于自定义型材框架如果缺乏标准安装孔间距是否能被称为“机架”,引发了一场小范围辩论,这也凸显了 DIY 构建的灵活性与标准化硬件兼容性之间的权衡。 总的来说,社区强调了家庭服务器基础设施中创意与实用性兼备的特质。

Claude Sonnet 5(自适应推理,最高效能)在智能方面处于领先地位,且与同价位模型相比性价比极高。该模型支持文本和图像输入,输出文本,并拥有 100 万 token 的上下文窗口。 Claude Sonnet 5(自适应推理,最高效能)在 Artificial Analysis 智能指数上得分为 53 分,远高于同类模型(平均分为 8 分)的平均水平。在进行智能指数评估时,它生成了 3 亿个 token,与 3700 万的平均值相比,输出非常详尽。 Claude Sonnet 5(自适应推理,最高效能)的定价为每 100 万输入 token 0.00 美元(定价具有竞争力,平均水平:0.00 美元),每 100 万输出 token 0.00 美元(定价具有竞争力,平均水平:0.00 美元)。

现代关于长寿的讨论已经转向了对健康潮流、可穿戴设备和实验性补充剂的个人化痴迷。尽管网红们将这些趋势推广为个人的生活方式选择,但作者认为,寿命从根本上来说是一个集体的社会学问题,而非个人问题。 借鉴阿道夫·凯特勒的“社会物理学”概念,文中强调预期寿命是由可衡量的社会条件(如犯罪暴露、环境毒素和经济不平等)决定的,而不仅仅是个人的习惯。尽管如此,“长寿工业复合体”仍在不断兜售剥离了背景的科学主张,以及如白藜芦醇和雷帕霉素等未经证实的奇迹分子。虽然个人仍需做出健康决定,但作者警告不要盲目地追求“生物黑客”。归根结底,我们必须超越对个人优化的关注,认识到社会结构而非补充剂方案才是健康的主要决定因素。正如作者所指出的:“社会铺就了寿命的基石,而个人则在其中生活。”

2021年,Reddit移动端应用“Relay”出现了一个技术漏洞,致使该平台的内部反垃圾信息元数据短暂地向身为版主的作者公开。通常情况下,Reddit会隐藏帖子被删除的具体原因,仅显示“自动”或“垃圾信息”等通用标签。这次短暂的泄露为人们提供了一个罕见的机会,得以深入了解Reddit的后端系统——特别是“spamurai”和较旧的基于Python的过滤器——是如何标记并删除内容的。 作者发现,Reddit运用了多种复杂的启发式方法,包括使用Perspective API(进行情感分析)、全域名封禁、正则表达式匹配以及URL重定向检测(如检测嵌入的Google Analytics ID)。数据还显示,Reddit的内部系统会追踪用户指纹、账号注册时长和ISP数据,以识别潜在的垃圾信息发送者。 作者多年来一直保留着这份研究,以防止恶意行为者利用这些漏洞。然而,他们决定在2026年将其发布,理由是现代大语言模型(LLM)的进步迫使各大平台彻底改革其垃圾信息检测机制,从而使这些旧技术在很大程度上已不再适用。这些发现为Reddit审核基础设施的演变提供了一个独特的历史视角,展示了其从早期的CRM114过滤器向现代人工智能驱动系统的过渡。

大型强子对撞机(LHC)已结束其最后一轮物理运行,标志着一个变革时代的终结。该时代包括了 2012 年希格斯玻色子的发现以及超过 85 种新强子的发现。自 2008 年以来,该设施不断拓展技术边界,并加深了人类对宇宙的理解。 欧洲核子研究中心(CERN)现已进入“第三次长期停机”(LS3),这是一项为期数年的大型项目,旨在将该设施升级为高亮度大型强子对撞机(HiLumi LHC)。HiLumi 升级计划于 2030 年启动,届时将使对撞机的亮度提高十倍,从而能够对希格斯玻色子进行更精确的研究,并探索超越标准模型的新现象。 此次停机涉及数千名专家,他们将更换包括 1.2 公里磁体在内的关键硬件,并升级 ATLAS 和 CMS 探测器以应对更高的碰撞率。在加速器离线期间,研究人员将继续分析现有数据集以获取进一步的见解。这项浩大的工程旨在重振整个加速器综合设施,确保该装置在未来几十年内始终处于高能物理研究的前沿。

欧洲核子研究中心(CERN)已正式启动“第三次长期停机”(Long Shutdown 3),暂停大型强子对撞机(LHC)的运行以进行重大升级。该项目旨在将设施转型为“高亮度大型强子对撞机”(HL-LHC),目标是将数据收集能力提升十倍,从而实现更精确的碰撞并推动更前沿的科学探索。 在Hacker News上,这一公告引发了曾参与研究的学者及访客们的怀旧与敬畏。许多用户感叹该设施的宏大规模,称地底下的探测器为“科技大教堂”,并强调了维持其运作所需的惊人工程复杂度。尽管一些物理学家直言不讳地分享了学术竞争的压力,以及部分粒子物理研究中重复性工作带来的挫败感,但主流舆论仍对该项目在人类知识进步方面的贡献表现出了深切的尊重。 讨论还触及了“大科学”的历史——特别是在将LHC与已取消的超导超级对撞机进行比较,以及管理艾字节(exabyte)级碰撞数据所展现出的物流奇迹。尽管目前处于暂时停机状态,科学界依然保持着极高的热情,视此次停机为确保LHC作为世界最顶尖科学前沿阵地的重要举措。

更多

联系我们 contact @ memedata.com