每日HackerNews RSS

## 计算大型堆砂身份:加速的故事 该项目专注于高效计算大型“身份堆砂”,这是对一个迷人数学概念的可视化。 最初的算法太慢——生成 100x100 的身份需要几秒钟,阻碍了对更大尺寸的探索。 目标是实现显著更快的计算,最终计算出 16384x16384 的身份,耗时不到一小时,相比于之前已知最大的例子(10,000x10,000,耗时 10 天)有了巨大改进。 主要有两种方法:“差分法”和“迭代燃烧法”。 作者改进了这两种方法,最终开发了一种利用堆砂与使用快速傅里叶变换和多重网格法求解泊松方程之间的关系的新方法。 这使得能够有效地将任何堆砂“投影”到数学理想状态(“零晶格”)上。 加速的关键在于认识到堆砂身份的尺度不变性,并递归地应用这种投影,从较小、预先计算的身份开始。 通过对“稳定化”函数进行细致的优化,也获得了显著的性能提升——这是算法的核心组件——利用了 AVX256、OpenMP、内存对齐以及利用对称性等技术。 虽然进一步的优化是可能的(AVX512、GPU 实现、改进的多重网格技术),但这项工作展示了在计算这些复杂结构方面取得了实质性的飞跃,为进一步的探索和可视化打开了大门。 代码可供那些有勇气探索它的人使用。

一个黑客新闻的讨论围绕着“eavan0”发表的一篇博客文章,文章详细介绍了高效计算大型“身份沙堆”的努力。这些沙堆在视觉上类似于康威的生命游戏,但总是会稳定下来,之前生成速度很慢——一个100x100的沙堆需要几秒钟。 为了创建更大、前所未见的沙堆身份,eavan0开发了一种更快的算法,被描述为之前一篇关于“美丽的阿贝尔沙堆”的博客文章的后续。讨论包括对损坏链接的修正以及与游戏“连锁反应”的比较。 几位用户在尝试访问博客时遇到了网站连接问题(PR_CONNECT_RESET_ERROR),eavan0对此进行了调查。总的来说,这篇文章和随后的对话凸显了计算效率、视觉模式和数学概念之间一个引人入胜的交叉点。

迈克尔·杰弗里·亚洲的经历凸显了人工智能兴起背后隐藏的人为代价。在肯尼亚,亚洲每天花费数小时标记色情内容并参与模拟的在线关系——本质上为人工智能性机器人提供劳动力——而报酬微薄。这项工作由算法控制,要求改变人物设定,对他的身心造成严重损害,导致失眠、创伤后应激障碍和性功能障碍,最终破坏了他的个人生活。 现在,作为数据标注者协会(DLA)秘书长,亚洲倡导改善这些经常被剥削的工人的工作条件。数据标注者对于训练和完善人工智能至关重要,但他们获得的报酬极低,缺乏足够的心理健康支持,尽管他们驱动着Meta、OpenAI和Gemini等科技巨头的估值。 DLA正在争取公平工资、福利以及结束限制性保密协议,将这种情况定义为现代跨国公司延续的殖民剥削。由于数据标注是肯尼亚科技劳动力中的重要组成部分,该运动寻求更广泛的团结以及对人工智能依赖弱势劳动力的伦理影响的认识。

```python from openai import OpenAI client = OpenAI( api_key="sk-your-key-here", base_url="https://api.ionrouter.io/v1" ) response = client.chat.completions.create( model="qwen3.5-122b-a10b", messages=[ { "role": "user", "content": [ {"type": "image_url", "image_url": {"url": "..."}}, {"type": "text", "text": "What's in this image?"} ] } ] ) ```

## IonRouter:快速且经济实惠的AI推理 (摘要) Cumulus Labs,一家YC W26初创公司,推出了IonRouter (ionrouter.io),这是一款推理API,旨在弥合开源和微调AI模型在速度和成本之间的差距。他们的目标是解决现有问题:快速的提供商价格昂贵(例如Together AI),而廉价的DIY方案(例如Modal)则需要大量的设置并存在冷启动慢的问题。 IonRouter利用定制的C++运行时IonAttention,专为GH200架构构建,实现了令人印象深刻的吞吐量——尤其是在多模态流水线中,达到了588个token/秒,超过了Together AI等竞争对手。目前,其延迟略高(p50 ~1.46s vs 0.74s),团队正在积极优化。 定价按token计算,没有空闲成本(例如,GPT-OSS-120B的输入为$0.02,输出为$0.095)。该服务允许用户轻松地在现有的OpenAI代码中替换基础URL,以访问更广泛的模型。目前,他们专注于展示其引擎,并计划扩展到托管微调模型,为定制AI部署提供简化的解决方案。他们正在积极寻求用户反馈,特别是那些使用微调模型的人。

## AurionOS:一个注重学习的操作系统 AurionOS是一个32位x86操作系统,由一位13岁的开发者用C语言和x86汇编从头开始构建,作为一个学习项目。它专为希望深入理解计算机的人设计,摒弃了现代抽象,以揭示硬件和CPU的核心逻辑。 该操作系统具有自定义引导加载程序、内核、内存管理(使用堆管理器)、VESA图形和窗口管理器,以及一个完整的TCP/IP协议栈,包括DHCP。它还包括一个自定义扇区文件系统(AurionFS),支持FAT12,以及一个拥有超过100个命令的命令行 shell。新命令可以轻松地直接在内核中添加。 AurionOS通过系统调用提供内核服务,目前处于测试阶段,正在进行错误修复。最好使用QEMU、VirtualBox或VMware来体验它。虽然实机启动正在开发中,但该项目完全开源,采用MIT许可证,体现了“每一字节都很重要”的原则。

## Linux 内存管理与快速虚拟机恢复:摘要 本次探讨深入研究 Linux 的内存管理,特别是 `mmap` 和 `userfaultfd` 等机制如何实现高效的虚拟机 (VM) 快照恢复。传统上,虚拟机通过页表与虚拟内存交互,转换为物理 RAM。`mmap` 允许分配内存区域*而无需*立即分配物理页面——这个过程称为按需分页。只有当进程访问该内存时,才会发生物理分配,由内核处理页面错误。 不同的 `mmap` 配置决定了物理页面如何管理(私有写时复制、共享、文件支持)。重要的是,使用 `MAP_FIXED` 替换映射会破坏旧的物理页面关联。这对于虚拟机来说是个问题,因为 KVM、VFIO 和 vhost-user 都依赖于一致的物理页面标识。 `userfaultfd` 通过允许用户空间*处理*页面错误来解决这个问题。它不是替换映射,而是按需填充现有的内存区域。这实现了近乎即时的虚拟机恢复:虚拟机立即启动,缺失的页面在被访问时从快照文件中加载。 虽然这种方法提供了显著的加速,但它也引入了开销(虚拟机退出、系统调用)以及如果处理程序无法跟上并发错误可能产生的瓶颈。它还会改变故障模式,并需要仔细考虑 I/O 模式和缓存。最终,`userfaultfd` 并不只是用于虚拟机;它是一个强大的工具,适用于任何需要延迟内存填充的系统。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Linux 缺页错误、MMAP 和 userfaultfd 用于快速沙箱启动时间 (shayon.dev) 15 分,shayonj 发表于 1 天前 | 隐藏 | 过去 | 收藏 | 3 条评论 帮助 deivid 发表于 1 天前 | 下一个 [–] 说“快”,到底有多快? 没看到任何测量结果。 shayonj 发表于 1 天前 | 父评论 | 下一个 [–] 你说得对。 我会从这里更新/移植回来 - https://github.com/cloud-hypervisor/cloud-hypervisor/pull/78..., 但速度相当快。 Anonbrit 发表于 1 天前 | 上一个 [–] “关键见解”这个短语现在让我感到不舒服,因为它在 LLM 写作中出现的频率太高了。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

wolfIP是一个专为资源受限的嵌入式系统设计的TCP/IP协议栈,优先考虑零动态内存占用。它以端点模式运行,通过单个网络接口建立连接,并使用类似BSD的非阻塞套接字API和自定义回调函数。 该协议栈支持关键协议,包括IPv4、ICMP、UDP和TCP(具有拥塞控制、SACK和时间戳等功能),以及DHCP和DNS客户端等应用程序,以及利用wolfSSL的HTTP/HTTPS服务器。 一个独特的功能是它的POSIX shim,`libwolfip.so`,允许将标准的套接字调用重定向到wolfIP,以便通过TAP接口使用`nc`和`ping`等工具进行测试。 此外,还提供了一个专用的FreeRTOS移植版本,采用后台任务和互斥锁保护的套接字访问。 wolfIP采用GPLv3许可,为嵌入式应用提供了一种强大且内存高效的网络解决方案。

## WolfIP:轻量级TCP/IP协议栈 WolfIP是一个新的、为嵌入式系统设计的TCP/IP协议栈,最近在Hacker News上分享。其关键特性是完全没有动态内存分配,旨在实现稳定性和可预测性。 讨论很快转向了与现有协议栈的比较,例如passt(用于QEMU和Podman容器)、Contiki uIP和lwIP。虽然这些替代方案已经存在,但WolfSSL(WolfIP的创建者)经常提供认证包和支持服务,吸引了需要保证可靠性和减轻责任的项目。他们还提供商业许可选项,以及GPL许可的代码。 一个核心争论集中在动态分配的必要性上。传统的TCP/IP实现由于缓冲而占用大量内存,但固定大小的缓冲区可以在受限的环境中工作。对话还涉及IPv6的持续采用,一些人认为其复杂性超过了其优势,特别是考虑到需要双栈配置和潜在的兼容性问题。最终,WolfIP为资源受限且确定性行为至关重要的设备提供了一种利基解决方案。

Sure.is 是一个 ANSI 艺术作品查看器。 适合比例(安全缩放) 精确宽度 手动 1x 标准 混合(颜色平均) 对角条纹 对角线(其他角度) 垂直线条 水平线条 棋盘/拜耳图案 交叉 人字纹 9×16 8×16 × Sure.is 是一个 ANSI 艺术作品查看器 当前文件 文件大小 × 字符 调色板条目 缩放 1x 查看 SAUCE Esc 键显示选项,空格键切换滚动 .ANS、.BIN 或 .ZIP(艺术包)   在此处拖放 ANSI 艺术文件   选择本地文件 16colo.rs 文件:加载 URL Esc 键显示选项,空格键(或手动滚动)切换自动滚动 -/+ 调整滚动速度 左右箭头(在移动设备上点击左右)用于 .ZIP 文件中的上一项/下一项。

## Sure.is:一个基于Web的ANSI艺术欣赏器 一个新的Web应用程序[sure.is](https://sure.is)允许用户查看和互动ANSI艺术——一种在早期计算机时代流行的数字艺术形式。由lubujackson创建,该欣赏器提供全宽渲染、波特率滚动和可选择文本,旨在重现在旧系统上查看ANSI艺术的体验。 创建者指出像素级完美缩放的技术挑战。用户可以通过(桌面上的“Esc”键)访问选项来调整速度和背景图案。虽然存在移动功能,但由于触摸限制,访问选项菜单比较困难。 用户赞扬了该欣赏器的真实性和拖放ZIP文件支持等功能。改进建议包括一个“显示不可见文本”的切换选项,以及利用现有的SAUCE解析能力,提供不同的颜色模式选项。该项目唤起了那些熟悉BBS系统和早期计算机艺术社区的人们的回忆。

## DDR4 内存初始化:摘要 DDR4 内存在使用前需要一个多阶段的初始化过程。该过程由 JEDEC 定义,包含四个关键阶段:**上电与初始化**、**ZQ 校准**、**Vref DQ 校准**和**读/写训练**。 **上电** 涉及将 DRAM 上线的特定序列,包括施加电源、取消复位以及加载模式寄存器以设置核心运行参数,如频率和 CAS 延迟。 **ZQ 校准** 使用外部参考电阻,将内部数据引脚 (DQ) 电阻微调至 240Ω,以补偿温度和电压引起的差异。 **Vref DQ 校准** 为数据线上的逻辑 0 和 1 建立精确的电压参考,这对于 DDR4 中使用的伪开漏 (POD) 终止方式至关重要。 最后,**读/写训练** 对齐时钟和数据信号,优化时序以实现可靠的数据传输。这涉及诸如写电平均衡、MPR 模式写入、读中心对齐和写中心对齐等算法,以考虑整个系统中的信号传播延迟。 根据应用的不同,可以启用**周期性校准**(ZQ 和读中心对齐)以在不同的运行条件下保持信号完整性。 成功完成这些步骤会将 DRAM 置于运行的空闲状态,准备好进行数据访问。

## DDR4 初始化、训练与校准:概要 一篇Hacker News讨论强调了DDR4(以及早期版本)内存系统初始化、训练和校准的复杂性。现代DDR实现需要广泛的训练过程来补偿制造差异、温度影响和系统噪声——这些问题由于商品DRAM的成本驱动设计而加剧。 早期尝试的设备级训练因环境因素而不可靠。虽然较新的DDR版本*似乎*“更容易”,因为供应商提供的IP和基于固件的训练,但该过程变得更加不透明,并且依赖于控制器内的“黑盒”校准处理器。 训练的必要性源于制造和PCB设计中固有的不精确性,影响信号完整性。这不仅仅是关于廉价组件;即使是昂贵的内存也需要校准来考虑时序偏差和信号特性。 历史上,训练涉及扫描控制器寄存器以找到稳定的工作范围。现代系统越来越多地依赖于连续自适应,类似于PLL,以维持信号完整性。由于专有供应商代码和该过程的复杂性,内存训练的开源固件仍然具有挑战性。

## IPv4x:一段并行的互联网历史 20世纪90年代,IPv4地址即将耗尽引发了关于互联网未来的争论。虽然IPv6提供了使用128位地址的干净解决方案,但完全取代IPv4似乎令人望而却步。一个引人注目的替代方案“IPv4x”提出*扩展* IPv4。 IPv4x通过保留原始的32位头部,将额外的96位添加到数据包主体中来保持兼容性。现有的IPv4路由器会忽略扩展,而支持IPv4x的路由器则利用完整的128位地址。每个现有的IPv4地址自动获得其下方一个巨大的“子空间”。 部署是渐进的和非破坏性的。对DNS和DHCP的更新允许可选的IPv4x支持,麻省理工学院成功的校园范围内的试验证明了其可行性。到2006年,IPv4x已经建立,IANA为其保留了未使用的/8块。 起初受到欢迎,但IPv4x因其促进点对点文件共享而受到音乐产业的强烈反对。然而,其易用性和无缝集成最终胜出。到2026年,IPv4x已成为常态,并促成了像2020年疫情期间轻松的视频会议等创新。 虽然是假设的,但IPv4x场景强调了渐进式演进而非革命性变革的路径。虽然它会保留遗留元素,但它强调了前进动力的重要性——这对于我们现实世界向IPv6的过渡具有借鉴意义。

更多

联系我们 contact @ memedata.com