MemeData

Transformer 需要三个投影吗？QKV 变体的系统性研究 Do transformers need three projections? Systematic study of QKV variants 30 天前

本文探讨了 Transformer 中标准的三个投影（Query、Key、Value）注意力机制是否绝对必要。通过系统地测试投影共享约束（具体包括 Q=K=V、Q=K=V 和 Q=K-V），作者证明了减少投影数量并不会显著影响性能。研究人员发现，**Q=K=V（共享键值）**变体尤为有效，在几乎不损失困惑度（perplexity）的情况下，实现了与传统架构相当的性能，并将 KV 缓存大小降低了 50%。此外，该方法与分组查询注意力（GQA）和多查询注意力（MQA）等现有技术具有高度互补性。结合这些策略，可以将 KV 缓存的内存占用率最高降低 96.9%，从而显著减少终端设备推理的内存开销。研究得出结论，键（Key）和值（Value）通常占据相似的表示空间，因此可以在不牺牲模型质量的前提下进行权重绑定。通过证明高性能模型可以在更少投影的情况下运行，该研究为在边缘设备上部署高效、内存优化的 Transformer 提供了实践路径。

抱歉。

我的两个电灯开关陷入了无限回响循环。 My two light switches got stuck in an infinite echo loop 30 天前

为了创建一个虚拟的三路开关，作者配置了两个基于 Tasmota 的智能开关，通过 MQTT 相互同步状态。该设置运行了数月，直到一次停电导致了“复制风暴”，两个开关陷入了相互触发的无限循环。作者最初认为是启动竞争条件（race condition），并尝试了各种类似启动计时器的“创可贴”式修复方案。在实时抓取日志后，真正的罪魁祸首显现：传入的镜像命令更新了开关的电源状态，但未能更新用于抑制回声的本地 `VAR1` 变量。由于传入的更改与过时的 `VAR1` 不匹配，规则总是被触发，从而导致了反馈循环。此外，作者还发现了一个硬件限制：其中一个开关（涂鸦设备）无法区分物理按键和 MQTT 命令。最终的优雅解决方案是改变通信流程：开关不再直接发送电源指令，而是发布一个 `SYNC` 事件。接收方在切换电源前先更新其 `VAR1` 变量，从而成功抑制了回声。作者总结道，比起推测基于时间的漏洞，验证代码部署和观察实时日志要有效得多。

抱歉。

Show HN: Hitoku Draft – 具有语境感知能力的本地助手 Show HN: Hitoku Draft – Context aware local assistant 30 天前

**Hitoku Draft** 是一款专为 macOS（Apple Silicon）设计的隐私保护型本地 AI 写作助手。它以极致安全为宗旨，完全离线运行——无需账户、云端连接或数据回传，确保您的数据绝不会离开设备。该应用可通过快捷键无缝集成至任何文本输入框，提供即时的 AI 编辑和多语言本地语音转文字功能。用户还可以直接拖放音频或视频文件，进行高速的本地转录。借助 Mac 的神经网络引擎（Neural Engine）与 GPU，Hitoku Draft 的运行速度比云端方案更快，且无需支付订阅费用。 Hitoku Draft 目前正处于早鸟优惠期，售价为 5 美元，采用“一次购买，永久使用”的模式。对于重视数据主权、不愿依赖订阅制 AI 服务的 Mac 用户来说，它是一款安全、隐私且长久的生产力工具。

蜂王从特制的蜡室中破茧而出。 Queen bees emerge from special wax chambers 30 天前

发表在《自然》杂志上的一项最新研究显示，蜜蜂幼虫能否发育成蜂王，不仅取决于蜂王浆，还取决于蜂房独特的成分。此前科学家认为蜂王的发育完全归因于饮食，但由昆虫学家鲍里斯·贝尔（Boris Baer）领导的团队发现，蜂王房是由一种“定制”蜡建造的，在结构和化学性质上都与标准蜂巢不同。这些蜂王房是由一群专门的年轻工蜂建造的，它们通过加热身体来改变蜡的形态。这种独特的材料含有更高水平的不饱和脂肪酸，并表现出与工蜂巢蜡不同的机械特性。实验证实，将蜂王幼虫移植到标准的工蜂房中，其死亡率很高，这证明了育儿房本身对生存至关重要。这些发现表明，发育中的幼虫会对环境提供的特定化学和物理信号做出反应。这一发现凸显了蜂群内部复杂精密的社会工程，工蜂会主动维护育儿房，以确保未来蜂王的生存。专家称赞这项研究是一项杰出的跨学科突破，或许也能解释其他蜂种的育王机制。

抱歉。

Show HN: Mercek – 一款用于 AWS ECS 的桌面 IDE Show HN: Mercek – A Desktop IDE for AWS ECS 30 天前

代理面板：你可以通过代理客户端协议（Agent Client Protocol）连接 Claude Code 等编码代理。它能够读取你的 ECS 状态，解释所发现的内容，并在应用中打开界面。它无法更改 AWS 中的任何内容。如果它建议进行更改，Mercek 会以差异对比（diff）的形式展示该更改，供你确认。

抱歉。

我对彻底变革学校教育的努力持怀疑态度。 I'm skeptical about efforts to revolutionize schooling 30 天前

尽管社会上普遍呼吁以项目式学习和批判性思维练习等“进步”方法取代传统教学，但研究一再表明，这些方法的效果不如传统教学。包括大规模的“后续追踪计划”（Project Follow Through）在内的多项研究显示，以结构化练习、明确教学和充分实践为特征的直接教学法，始终能带来更好的学术成果。与“死记硬背和书桌工作已过时”的观点相反，专业能力的建立从根本上依赖于大量知识和技能的积累，而这需要投入大量且专注的努力。作者认为，激进的教育改革往往是误入歧途的，因为它忽视了学习的认知局限。虽然教育技术在游戏化或定制化教学方面展现出一定潜力，但它往往缺乏课堂环境的严谨性以及教师的细致指导。归根结底，虽然高动力个体可以通过替代方法成功实现自主学习，但普通学生仍能从强调通过练习来掌握知识的结构化课程中受益最多。我们不应摒弃传统教学，而应致力于优化其效率，并承认建立专业能力没有捷径。

这次 Hacker News 的讨论探讨了围绕“彻底改变”学校教育的努力所存在的怀疑态度。参与者认为，真正的教育改革往往因对学习机制的误解以及课堂现实的忽视而受阻。主要议题包括： * **直接教学与发现式学习的博弈：** 许多评论者认为，“发现式”学习往往效率低下甚至适得其反。他们主张，严谨的直接教学辅以刻意练习，才是实现精通的最可靠途径，尤其是对于缺乏内在动力的学生而言。 * **“普通教师”问题：** 参与者指出，学校系统必须为普通教师而非罕见的“天才型”教师设计。大家一致认为，有效的教学需要明确的“脚手架”支撑，以及根据学生需求进行调整的能力。 * **社会现实：** 批评者指出，学业表现很大程度上由校外因素决定，包括家庭生活、家长参与度和社会经济稳定性。一些人认为，学校的目标往往是社会管理和提供资历认证，而非单纯的智力开发。 * **对体制的怀疑：** 许多人认为，公立学校因其规模庞大且缺乏竞争激励机制，导致其本质上效率低下，无论投入多少资金，都难以实现有意义的大规模改进。

IPv6区域标识符在URL中是一个错误。 IPv6 zones in URLs are a mistake 30 天前

本网站目前使用“Anubis”来保护服务器，防止激进的 AI 网络爬虫导致网站瘫痪。Anubis 的工作原理是要求用户完成一个小型工作量证明（Proof-of-Work）挑战。对于普通访客而言，这几乎不占用时间，但对于大规模的自动化爬虫操作来说，其计算成本很高。网站管理员认为这只是一个临时措施。他们正在积极开发更先进的方法（例如识别无头浏览器指纹），以便最终让合法用户完全绕过这些挑战。请注意，Anubis 依赖于现代 JavaScript 功能。如果您正在使用诸如 JShelter 之类的安全插件，则必须为此域名将其禁用才能访问本网站。

Show HN：形式化验证多边形相交——Opus 4.8 一次性通过，此前曾失败 Show HN: Formally verified polygon intersection – Opus 4.8 oneshots, prev failed 30 天前

该项目介绍了首个经过形式化验证的多边形交集算法实现，利用 Lean 4 证明助手确保其在所有可能的几何配置下均保持正确。计算几何算法因其罕见的边缘情况和内部集合的无限性，往往难以进行测试，而形式化验证确保了该算法的稳健性。该项目展示了人工智能辅助开发的重要演进：早期的模型在处理复杂证明策略时需要人工指导，而近期模型（如 Claude Opus 4.8）已能够自主生成经过验证的代码并驾驭复杂的证明，包括基于欧拉回路的逻辑。至关重要的是，该架构将实现与验证进行了分离。人类只需审阅 87 行简短的规范，即可确保算法逻辑的严密性。信任完全建立在 Lean 检查器而非大语言模型之上，有效地将人工智能的生成速度与项目的数学可靠性解耦。这种方法能够在最大限度减少人工监督的同时，开发出复杂且经过验证的软件，尽管目前验证代码在计算性能上可能为了简洁性而有所妥协。用户可通过网页演示实时可视化这些经过验证的交集。

一位开发者发布了据信是首个经过形式化验证的多边形求交算法实现。该项目利用 Lean 定理证明器，通过数学证明而非传统的测试来确保算法的正确性。作者强调，近期人工智能的进步（特别是 Opus 4.8）起到了关键作用，因为该模型能够一次性生成算法及其形式化证明，而早期模型则需要大量的人工引导和多步提示。为了保持数学严谨性，核心实现使用了精确的有理数坐标而非浮点数，从而避免了计算几何中常见的精度问题。该项目包含一个网页演示，使用了直接从 Lean 编译的 WebAssembly，允许用户与经过验证的核心进行交互。虽然基于 JavaScript 的用户界面未经形式化验证，但处理复杂几何边缘情况（如空洞、自相交和重叠边）的逻辑均由 Lean 检查器提供保证。目前，开发者正在探索将这种验证方法扩展到三维多面体，这预示着人工智能与形式化验证协作构建高度可靠、实用软件的未来前景广阔。

无分支快速排序，比 std::sort 和 pdqsort 更快，提供 C 和 C++ API。 Branchless Quicksort faster than std:sort and pdqsort with C and C++ API 30 天前

**blqsort** 是一款高性能、无分支（branchless）的快速排序实现，旨在通过减少 CPU 分支预测错误来超越标准库的排序算法。该算法通过利用辅助缓冲区和用于小数据集的排序网络，消除了内循环中的条件分支，从而显著缩短了在现代硬件上的执行时间。在 Apple M1 和 AMD Ryzen 系统上的基准测试表明，blqsort 的性能始终优于 `std::sort` 和 `pdqsort`。为了保持稳健性，它采用了中位数的中位数（median-of-medians）作为枢轴策略，在分区不平衡时回退至堆排序，并针对非平凡、高代价的数据类型提供了专门的变体。该库专为在 C 和 C++ 环境中易于使用而设计，提供与 `std::sort` API 相似的仅头文件（header-only）实现。它支持单线程和多线程执行，并且比典型的基于 SIMD 的排序库能更灵活地处理自定义数据结构。对于寻求优化性能的开发者而言，blqsort 提供了一种直接替换方案：它通过增加数据拷贝量，换取了在现代深度流水线 CPU 上更快的处理速度。

抱歉。

伊朗局势震动亚欧，加速能源转型 Iran Shock Jolts Asia and Europe to Speed Up Energy Transition 30 天前

Bloomberg 需要帮助？请联系我们我们检测到您的计算机网络存在异常活动要继续访问，请点击下方方框以确认您不是机器人。为什么会出现这种情况？请确保您的浏览器已启用 JavaScript 和 Cookie，且未阻止它们加载。有关更多信息，您可以查阅我们的服务条款和 Cookie 政策。需要帮助？有关此消息的咨询，请联系我们的支持团队并提供下方的参考 ID。屏蔽参考 ID：4fba26e1-605d-11f1-acd1-a33f36735b32 订阅 Bloomberg.com，随时随地掌握最重要的全球市场新闻。立即订阅

抱歉。

每日HackerNews RSS