MemeData

日益严峻的算力短缺 The Growing Compute Shortage 17 小时前

人工智能革命已从纯粹的软件竞赛，转变为一场针对物理基础设施的工业级竞争。先进制程半导体产能（特别是台积电的 N3 节点）、高带宽内存（HBM）以及电力供应的严重短缺，正造成重大的瓶颈。据预计，到 2030 年，数据中心的电力需求将达到 200 至 300 吉瓦，这导致变压器和燃气轮机等关键组件早已被预订一空，未来几年的产能已供不应求。这种稀缺性正在从根本上改变市场估值。曾经被视为过时的资产，如拥有现有电力和电网接入的前加密货币挖矿场地，正作为“拉撒路资产”（Lazarus assets）重新焕发活力。与此同时，计算能力的获取已成为一种战略性的“竞争护城河”；尽早确保供应的企业占据了主导地位，而其他企业则面临配额限制或更高的成本。最终，这种物理限制可能会暂时逆转人工智能成本下降的趋势，并可能减缓该技术向小型企业的普及。随着软件规模与芯片、散热和电力等有形资源紧密挂钩，人工智能竞赛的赢家将不仅由算法决定，还将取决于他们控制支撑这些技术所需稀缺物理基础设施的能力。

Arduino 推出用于远程传感器项目的即插即用模块 Arduino Launches Plug-and-Play Modules for Long-Range Sensor Projects 19 小时前

请启用 JavaScript 和 Cookie 以继续。

抱歉。

Qwen-Image-3.0: Rich Content, Authentic Details, Deep Knowledge 19 小时前

关于阿里巴巴“Qwen-Image-3.0”模型的 Hacker News 讨论已从技术评估转向对其产品元数据的争议。用户发现该模型的网页 HTML 元标签中包含大量 NSFW（不适宜工作场所）相关关键词以及诸如“hentai”和“pregbant”等奇怪的垃圾搜索词。批评者嘲讽这种做法是“AI 废料”，并指出由中国公司开发模型却使用违禁成人内容的 SEO 手段，具有极大的讽刺意味。除元标签丑闻外，讨论还重点关注了该模型的可访问性问题。用户表示，阿里巴巴并未提供有关模型权重发布的信息，这延续了 Qwen-Image-2.0 的闭源性质。评论者还指出了宣传图片中的视觉伪影，例如解剖学错误。虽然技术讨论有限，但用户简要探讨了 16GB 显存配置下的最佳本地替代方案（如 Krea-2-Turbo），另有观点指出，图像生成技术的快速商品化表明，这些模型已难以提供持久的竞争“护城河”。

如何将三进制数打包进 8 位字节中 How to pack ternary numbers in 8-bit bytes 20 小时前

本文详细介绍了一种用于 BitNet b1.58 等模型中三进制权重（trits）的高效打包方法。为优化存储与性能，作者采用了一种块大小设置，即将 5 个三进制位打包进 8 个比特中，实现了 99.06% 的信息密度效率。在大型语言模型推理中，解包这些权重的关键难点在于，模运算和除法运算在 SIMD（单指令多数据流）环境中通常执行缓慢或不受支持。为解决这一问题，作者采用了一种定点乘法技术：通过将字节乘以特定常数，无需使用昂贵的除法即可从结果位中提取三进制位。该方法确保了数据的无损恢复，并显著加快了并行解包的速度。目前，该技术已在 `llama.cpp` 中针对 AVX2 和 ARM NEON 架构完成实现，为处理三进制权重模型提供了高性能解决方案。

这篇 Hacker News 的讨论探讨了将三进制数（trits）封装进标准二进制字节的实用技术。核心在于表示三进制的效率——用 8 位存储 5 个三进制数是很常见的做法，但若要接近每个三进制数仅需 1.585 位的理论极限，则需要更大的分组（例如 256 位存储 161 个三进制数）。讨论强调了几个技术要点： * **性能：** 虽然简单的实现方式直截了当，但在现代 CPU 上获得最佳性能通常需要使用查找表或 SIMD 优化的定点运算，以避免昂贵的除法操作来提取三进制数。 * **应用场景：** 该技术与现代“三进制”大语言模型（如 BitNet b1.58）高度相关。这类模型通过将权重限制在 {-1, 0, 1} 范围内，旨在提高内存和能源效率。 * **实现挑战：** 用户探讨了使用查找表还是定制硬件指令能获得更快的速度。一些人认为，现有架构中的实际开销使得这些方法并不像学术论文中描述的那样简单直接。最终，该讨论反映了理论信息密度与缓存、SIMD 向量化及硬件设计等实际现实之间的平衡。

VTuber：日本现象如何走向世界 VTubing: How a Japanese Phenomenon Is Going Worldwide 21 小时前

请启用 JavaScript 和 Cookie 以继续。

Hacker News 近期关于虚拟主播（VTuber）兴起的讨论，凸显出这一数字现象既备受争议又已根深蒂固。一些评论者认为该趋势在新冠疫情期间已达顶峰，但另一些人指出，随着低成本易用软件的普及，准入门槛显著降低，推动了独立创作者群体的规模化扩张。关于该行业的争论仍在持续： * **目的：** 观众和创作者对虚拟主播的定位各异，有人将其视为保护隐私的工具、表演艺术的创意出口，或是建立准社会关系（Parasocial connections）的方式——这常被拿来与日本偶像文化作比较。 * **企业与独立：** 像 Hololive 这样的大型经纪公司提供结构化的职业支持和高制作水准，但要求严格的品牌管控和版权所有；相比之下，独立领域则高度去中心化且更具实验性。 * **评价：** 批评者认为该行业利用了男性的孤独感，而粉丝则坚持认为它培育了真实的社群、创意表达和避风港。归根结底，虚拟主播已从日本的小众亚文化发展为全球主流媒介。尽管在人工智能使用、角色所有权和周边商品化方面存在争议，它仍是一个稳健且不断演进的生态系统，将传统的直播与角色驱动的表演融合在一起。

Linux 内核将支持 $ORIGIN，某种程度上。 Linux kernel will support $ORIGIN, sort of 21 小时前

在 2026 年的 TacoSprint 活动中，作者提议通过在 `PT_INTERP` 段中增加对 `$ORIGIN` 的内核级支持，以实现 Nix 中的可重定位二进制文件。作者本预想会遭到反对，结果却与 Linux VFS 维护者 Christian Brauner 进行了富有成效的合作。他们没有采用简单的补丁，而是利用 eBPF 和 `binfmt_misc` 开发了一套解决方案。通过将解释器选择卸载到可编程的 eBPF 内核模块，系统能够动态解析路径，从而有效地支持可重定位二进制文件。一项关键的突破是增加了新的 `binfmt_misc` 分发模式（“L 标志”），该模式允许内核在原生执行二进制文件的同时简单地覆盖解释器。这避免了通常困扰解释器切换的标识问题，例如 `argv[0]` 或 `/proc/self/exe` 解析错误。展望未来，作者计划引入一个利用自定义 `PT_INTERP_NIX` 段的 NixOS 模块。这种方法确保了向后兼容性，仅允许选择加入的二进制文件获得可重定位能力。这一进展显著推动了 Nix 生态系统的边界，使其向真正可移植、与环境无关的二进制文件迈进了一步。

这段 Hacker News 的讨论探讨了一项拟议的 Linux 内核变更，旨在为可执行加载器（executable loaders）和 shebang 行引入对 `$ORIGIN` 的支持。从历史上看，尽管动态链接器（`ld.so`）支持使用 `$ORIGIN`（代表可执行文件所在的目录）进行依赖解析，但内核本身要求解释器（`PT_INTERP`）必须使用绝对路径。这迫使二进制文件必须硬编码指向 `/lib64/ld-linux-x86-64.so.2` 等系统加载器的路径，从而阻碍了可移植性。支持者认为，内核级对 `$ORIGIN` 的支持将允许二进制文件携带自己的加载器，从而实现更具可移植性、自包含的应用程序——这也是 Nix 和各种应用打包工具长期追求的目标。然而，讨论中也出现了对此方案的怀疑声音。批评者指出，为此目的修改内核可能显得“怪异”或不必要，并建议通过更好的加载器委托或元数据管理在用户空间解决此问题。此外，一些参与者警告称，将 Bazel 等构建系统的模式引入内核，可能是在移植“缺陷”而非采纳最优的架构方案，这引发了关于系统级兼容性与专业化二进制分发之间权衡的辩论。

```Mathup 中的张量符号``` Tensor Notation in Mathup 21 小时前

**Mathup** 是一款轻量且直观的工具，旨在将类 AsciiMath 的简单语法转换为结构化的 MathML。与 MathJax 等进行繁重渲染的方案不同，Mathup 专注于解析与转换，将渲染工作交给浏览器，从而实现显著提升的性能。 Mathup 专为追求速度且不愿使用冗长 TeX 语法的作者设计，其逻辑清晰的语法可处理标准数学表达式，包括： * **标记识别：** 自动将标识符、运算符和数字包裹在相应的 MathML 标签中。 * **复杂格式：** 支持使用简洁明了的语法编写分数、上下标、矩阵、张量和根式。 * **自定义：** 允许通过 CSS 自定义属性对字体、颜色和样式进行精细控制。 Mathup 具有高度的灵活性，支持命令行使用、Node.js 以及直接集成到浏览器中。对于希望在网页上快速编写数学内容且不愿受繁杂软件困扰的用户来说，这是一个理想的解决方案。尽管它不支持所有的 MathML 特性，但为编写常用数学表达式提供了一种高效且富有表现力的方式。

对不起。

一个能够处理十倍于 Nginx+PHP-fpm 并发请求的 PHP 服务器 A PHP server that can handle 10x as many concurrent requests as Nginx+PHP-fpm 22 小时前

Qbix Server 是一款高性能的纯 PHP 网络服务器，旨在替代传统的 Nginx/PHP-FPM 架构。它能够在单一进程中处理静态文件、PHP 脚本和 WebSocket，且无需外部依赖。 **主要优势：** * **10 倍并发能力：** 通过“预加载后分叉”（fork-after-preload）架构，Qbix 利用了操作系统层级的写时复制（copy-on-write）内存共享机制。相比 PHP-FPM 为每个工作进程复制整个框架（每个占用 30-60MB），Qbix 共享基础内存，将每个工作进程的开销降低至约 5MB。 * **零引导延迟：** 框架类、配置和数据库连接在父进程中仅加载一次。工作进程继承此状态，消除了 PHP-FPM 每个请求中 10-50 毫秒的引导成本。 * **真正的“无共享”安全性：** 与可能导致请求间“状态泄露”的 Swoole 或 FrankenPHP 不同，Qbix 为每个请求分叉出一个全新的进程。这确保了完全的隔离性，在保持 PHP 完全兼容性的同时，防止了内存泄漏和安全漏洞。 * **高级功能：** 内置组件级缓存失效机制（`X-Cache-Tree`）、访问控制的静态文件流式传输（`X-Accel-Redirect`）以及一个轻量级的微框架。 Qbix Server 是寻求最大化扩展性与部署简便性，且不愿牺牲现有 PHP 代码或安全性的开发者的理想选择。

GitHub 上一个新的 PHP 服务器项目声称能处理传统 Nginx+PHP-fpm 架构 10 倍的并发请求。这一消息在 Hacker News 上引发了开发者的讨论，既有兴奋也有质疑。评论者提出了几个技术方面的担忧： * **稳定性：** 对服务器如何管理“不良”客户端，以及单个连接挂起时是否会导致资源耗尽存有疑问。 * **兼容性：** 用户质疑其能否支持 WordPress 等传统生态系统。他们指出，像 Swoole 或 Workerman 这样的替代方案，往往难以应对 WordPress 对全局状态和特定标头的严重依赖。 * **瓶颈：** 一些人指出，对于许多 PHP 应用程序来说，主要问题在于 CPU 密集型执行而非请求并发，这意味着该服务器可能无法改善所有使用场景的性能。尽管该项目前景广阔，但社区的共识是采取“观望”态度，因为该技术目前过于新颖，尚不适合大规模应用于生产环境。

食品杂货旅游的兴起 The Rise of Grocery Tourism 22 小时前

尽管“超市旅游”如今已成为一个流行标签，但作家妮可·詹姆斯（Nicole James）早已深谙探索外国超市之道。作为曾经的超市收银员，詹姆斯将超市视为“带着购物篮的人类学”——一种避开旅游景点刻意营造的门面，从而发现某种文化最原始、最真实一面的方式。博物馆和餐馆往往展示着一个国家希望被铭记的内容，而超市则揭示了一个群体私密的日常生活真相：当他们感到疲惫时吃什么，他们的经济现状，以及他们独特的区域焦虑。从日本制作精良的三明治和稀奇古怪的奇巧（KitKat）口味，到荷兰人对甘草糖的痴迷，再到越南令人震惊的蛇酒，这些货架为人们提供了一窥当地生活方式的真实视角。与奢侈品购物不同，超市旅游具有大众化和真实性的特点。它让游客能将目的地的一件有形且往往令人费解的东西带回家——一罐芥末或一种奇特的零食，作为“未经修饰的日常”的纪念品。归根结底，詹姆斯认为超市旅游就是一种专注观察的艺术，证明了一个国家的真实品格往往隐藏在饼干和清洁用品之间。

抱歉。

Reverse-engineering is cheap now 22 小时前

每日HackerNews RSS