每日HackerNews RSS

## REXC:JSON 的更快、更小替代方案 REXC 是一种数据编码格式,旨在作为 JSON 的直接替代品,在大小和速度方面都具有显著改进。它通过二进制编码数字、字符串去重、共享模式和前缀压缩,实现高达 **18 倍更小**的输出。重要的是,REXC 通过实现 **23,000 倍更快的单键查找**(O(log n))*而无需*预先解析,避免了 JSON 的解析/内存权衡。 REXC 通过 **近乎零堆分配** 最小化内存使用;解析后的数据通过平坦字节缓冲区上的代理访问,避免了 GC 开销。它与 JavaScript 完全互操作——消耗解析后的 REXC 数据的现有代码无需更改。 **主要特性:** * **安装:** `npm install @creationix/rx` (库), `npm install -g @creationix/rx` (CLI) * **用法:** `JSON.stringify` 和 `JSON.parse` 的直接替代品。 * **CLI 工具:** 在 REXC 和 JSON 之间转换,检查编码结构,并选择子值。 * **低级访问:** 提供游标 API,用于零分配遍历和直接字节操作。 * **定制化:** 提供索引、字符串链和外部引用的选项。 REXC 非常适合性能关键型应用程序和处理大型数据集的场景。更多详细信息和性能基准测试可在 `rx-perf.md` 文档中找到。

## RX:一种新的随机访问JSON替代方案 Creationix推出了RX,一种旨在成为特定用例下更高效的JSON替代数据格式。与传统的JSON不同,RX优先考虑随机访问和减少内存占用,尤其是在处理大型只读数据集时。 RX在保持ASCII文本编码以实现复制粘贴兼容性的同时,实现了与CBOR或Protobuf等二进制格式相当的压缩率。它特别适用于只需要访问大型数据结构中一小部分的情况,避免了解析整个文件的开销。 主要特性包括保留JSON的数据类型(包括任意精度小数)和键的顺序,同时实现O(1)的数组查找和O(log2 N)的对象查找。作者强调了嵌入式数据库和查询构建工件等用例。然而,RX并非JSON的通用替代品,只有在完全解析和解压缩开销不可取时,其优势才最为明显。文档和查看器可在GitHub上获取。

## Uxn CPU 实现与 AI 辅助开发 该项目详细介绍了为 Uxn CPU 创建 x86-64 汇编实现的過程,Uxn 是一种用于 Hundred Rabbits 生态系统中的虚构 CPU。作者之前已经创建了快速的 Rust 和 ARM64 汇编实现,并利用大型语言模型(特别是 Anthropic 的 Claude 和 Opus)将汇编代码移植到 x86-64 平台。 最初,Claude 自动生成了一个可用的,但并不完美的 x86-64 实现,成本约为 29 美元。虽然需要大量人工清理——解决诸如寄存器滥用和低效指令等问题——但它提供了一个关键的起点,大大加速了开发。随后,通过模糊测试发现了一个错误,需要进一步调试,Opus 4.6 展示了令人印象深刻的调试能力,甚至识别出一个微妙的越界写入。 这个过程凸显了综合测试(单元测试和模糊测试)对于 AI 辅助编码的价值。虽然作者对完全依赖 AI 生成的代码仍然持谨慎态度,但他们承认它有潜力降低开发门槛并能够处理更复杂的任务。最终实现现在已经合并并发布,展示了人类和 AI 工程之间成功但细致的合作。

这场 Hacker News 讨论围绕着 Uxn 虚拟机的一个新的 x86-64 后端,以及更广泛地,关于 LLM 和可持续计算的哲学辩论。 最初的帖子引发了讨论,因为其作者的一项推荐被从与“100R”运动相关的资源列表中删除——该组织专注于计算领域的可持续性和生态正义。评论员认为 100R 认为作者对 LLM 的观点不足,尤其是在其社会和经济影响方面。 这场讨论凸显了那些倡导资源密集型技术(如 LLM)的人与那些优先考虑低影响、替代计算方法的人之间的紧张关系。一些人反对对 LLM 的一概否定,认为即使在可持续框架内,它们也可能是潜在的有用工具,而另一些人则对其环境成本以及取代人类技能的潜力表示担忧。 存在关于是否使用当前系统(包括 LLM)来构建更可持续的替代方案在伦理和实践上是否可行的问题。 最后,一个附带的对话涉及 Uxn 机器本身,澄清它不使用传统的 ROM,而是使用加载到 RAM 中的自修改代码,这使得即时编译 (JIT) 具有挑战性。

## 自动AI MaxSAT求解器取得最先进成果 一个自主AI代理,利用如Claude Code等工具,被部署成为MaxSAT问题解决领域的顶尖专家——无需任何人工干预。该代理在2024年竞赛的229个加权MaxSAT实例上运行,通过自我实验、学习和代码改进迭代地提升其性能。 该代理通过阅读指令、访问积累的知识、利用可用的求解器工具,并将改进提交到GitHub仓库,以促进多个代理实例之间的协作学习来运作。它取得了令人印象深刻的结果:解决了229个实例中的220个,在130个实例上匹配或超越了竞赛的最佳解决方案,甚至为先前未解决的一个实例发现了一种新的解决方案。 其成功的关键在于自主开发了诸如带选择器的贪婪SAT、核心引导搜索和动态子句加权等新策略。虽然存在并行度低和在困难实例上偶尔出现“隧道视野”等局限性,但该代理明显推动了该领域的发展,创建了一个不断演进的知识库和求解器库。

## 推理电路:通过层复制提升LLM性能 研究人员发现了一种显著提升大型语言模型(LLM)推理能力的方法,*无需*任何训练或权重调整。该方法基于David Ng的RYS方法,简单地复制模型架构中的特定连续层即可产生显著的性能提升。 在Qwen2.5-32B和Devstral-24B上的实验表明,Qwen2.5的**推理能力提升了17%**,Devstral的**逻辑演绎能力提升了245%**(在BBH上从0.22提升到0.76)——仅通过复制3层即可实现。这些“推理电路”表现为3-4层的块,经过两次处理后,可以增强认知功能。 该过程可以在消费级GPU(如AMD RX 7900 XT/6950 XT)上运行,耗时一个晚上。它涉及使用提供的工具包识别需要复制的最佳层块。不同的复制模式甚至可以针对特定技能定制模型(数学与情商)。其核心原理是重新路由隐藏状态,有效地让模型通过其推理流程进行第二次传递,使用相同的权重和最少的额外VRAM。这种方法与微调互补,并提供了一种解锁现有LLM隐藏潜力的新方法。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 Tomy Spinjas (medium.com/solidi) 6 分,由 biscuits1 1 天前发布 | 隐藏 | 过去的 | 收藏 | 1 条评论 帮助 crtasm 1 天前 [–] >注意:以上产品图片已使用 Nano Banana 2 修复。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

得克萨斯州奥斯汀市在2015年开始实施积极的政策变革,经历了显著的住房逆转。在经历了多年快速增长推动的租金飙升(2010年至2019年增长93%)之后,该市专注于消除新建住房的障碍。 关键改革包括放宽分区规定,允许在就业和交通枢纽附近进行更密集的开发——特别是公寓,以及2.5亿美元的经济适用房债券,和简化的许可流程。这些努力推动了住房单元数量增加了30%(2015年至2024年间增加了12万套),超过了全国的增长速度。 因此,奥斯汀的租金*下降*了——2021年至2026年下降了4%,即使人口持续增长。降幅在较旧、更经济实惠的建筑中最为显著。该市还通过支持辅助住宅单元、联排别墅和减少停车要求等举措,鼓励了多样化的住房类型。 奥斯汀的成功表明,一种多方面的策略——专注于增加供应*和*可负担性——可以有效地解决住房短缺并稳定成本,成为其他快速发展的城市的典范。 持续的改革旨在进一步简化开发,并确保持续的住房供应。

启用 JavaScript 和 Cookie 以继续。

## 黑客新闻讨论摘要:HTTP 上有什么? 一个黑客新闻的讨论围绕着网站 [whatsonhttp.com](https://whatsonhttp.com),该网站扫描互联网以寻找仅使用 HTTP 的网站。核心争论在于 2026 年继续使用 HTTP 的相关性和安全影响。 许多评论者认为*强制*使用 HTTPS 侵犯了用户隐私,假定了一种可能与其需求不符的威胁模型,并且对于内部网络来说是不必要的。维护 HTTPS 证书(过期、自动化、DNS 挑战)以及现代 TLS 配置的复杂性经常被提及。一些人提出了使用本地 CA 用于内联网的解决方案。 然而,另一些人则强烈提倡 HTTPS,强调了未加密 HTTP 流量的风险(ISP 操纵、数据修改),并质疑维护长期 HTTP 网站的可行性。一个反驳观点是,静态 HTTP 网站本质上更稳定,需要的维护更少。 最终,这场讨论揭示了可访问性、安全性和维护网络基础设施的实际情况之间的紧张关系,并逐渐达成共识,认为在许多用例中,提供 HTTP 和 HTTPS 都能提供最佳平衡。

## 无处不在的正态分布:摘要 正态分布,或称钟形曲线,在数据中出现的频率令人惊讶——从降雨量到考试成绩。这并非巧合,而是**中心极限定理**的结果,这是统计学的基础原理之一。该定理指出,许多独立随机变量的平均值将近似于正态分布,无论这些变量的原始分布如何。 该定理最初由亚伯拉罕·德莫弗尔在18世纪伦敦研究赌博时发现,后来由皮埃尔-西蒙·拉普拉斯正式化,揭示了混沌中的隐藏秩序。即使是看似随机的事件,经过反复平均后,也会产生可预测的模式。 这一原理对于现代科学至关重要,使研究人员能够自信地对世界进行推断。它嵌入在统计方法中,即使在缺乏对底层过程的详细了解的情况下,也能进行分析。然而,该定理依赖于大量独立的样本,可能不适用于分析极端事件或有偏差的数据。尽管存在局限性,中心极限定理仍然是统计分析的基石,为理解和解释数据提供了一个强大的工具。

## 黑客新闻讨论:正态分布的普遍性 近期一篇《量子》杂志的文章探讨了为什么正态分布(钟形曲线)如此频繁地出现,引发了黑客新闻的讨论。核心解释在于**中心极限定理 (CLT)**:对许多独立随机变量求平均值,无论它们最初的分布如何,都趋向于正态分布。 然而,评论者们争论了这种现象的*普遍性*。虽然在数学上是正确的,但 CLT 依赖于有限方差,而现实世界的数据往往不满足这一条件。许多人指出,**重尾分布**(例如金融市场或极端事件中发现的分布)很常见,并且违反了 CLT 的假设。 讨论强调,正态分布的普遍性可能更多地是由于其**数学上的易处理性**——简化建模和分析——而不是其内在的存在于自然界中。其他人指出,理解**CLT 的局限性**以及在处理异常值或非有限方差时考虑替代分布的重要性。 许多用户推荐像 3Blue1Brown 的视频这样的资源,以便直观地理解这些概念。最终,这场对话强调,虽然正态分布是一个强大的工具,但它是一种近似,对其局限性的批判性理解至关重要。

(Empty input provided. There is nothing to translate.)

这个Hacker News讨论围绕着使用AI代码生成(特别是Anthropic的Claude Code)时遇到的有趣和令人沮丧的经历。 几位用户分享了“失败”案例:一个涉及Makefile中经典的制表符与空格问题(导致游戏开发延误),另一个是AI生成的C头文件创建了奇怪的寄存器名称,如“P00”,以及对古怪输出的普遍观察(“小心,像腌黄瓜一样!”)。 一个反复出现的主题是对帖子真实性的怀疑,一位用户怀疑OpenAI进行了一场协调的“心理战”,因为一个新创建的账户发布了初始链接。 还有关于初始帖子是否由AI生成的争论。 最终,这个帖子突出了AI编码工具的现状——功能强大,但仍然容易出错,需要仔细审查。

这篇文章反对使用如Ring之类的门铃摄像头,甚至提议将其移除或破坏。作者认为这些设备助长了猜疑氛围,将社区变成了不信任的区域,并模仿了极权主义的监控手段。 核心论点并非在于阻止实际犯罪,而在于拒绝基于恐惧的世界观。对入室盗窃或包裹被盗的担忧被认为是统计上不太可能发生,并且最终造成的损害小于持续监控所带来的焦虑和社区丧失。现有的安全措施,如锁和猫眼,被认为是足够的。 作者将这些摄像头的普及视为社会病态的症状,认为它们将房屋变成了监狱,并侵蚀了对邻居的基本信任。他们最终将摄像头本身——以及那些销售它们的人——定位为真正的威胁,敦促读者优先考虑内心的平静,并拒绝以恐惧为定义的生活。

## Ring 摄像头与隐私:Hacker News 讨论 一篇近期倡导移除 Ring 摄像头的文章在 Hacker News 上引发了争论。作者将这些设备描述为助长猜疑和偏执,但许多用户不同意,认为它们在信任度较低的地区提供了一种合理的安全措施。 许多评论者强调了除了安全之外的实际用途——包裹监控、识别野生动物,甚至为财产损失或骚扰等事件提供证据。人们对亚马逊 Ring 的数据实践和潜在的大规模监控表示担忧,许多人更喜欢通过 Reolink 或 HomeKit Secure Video 等系统存储本地录像。 讨论显示出分歧:有些人认为摄像头对于安心和问责至关重要,而另一些人则认为它们加剧了不信任文化。一个关键点是,录像的好处通常不在于警方干预,而在于个人审查和释怀。最终,用户强调了拥有自己数据的权利,以及选择优先考虑隐私而非便利性的系统的重要性。

更多

联系我们 contact @ memedata.com