每日HackerNews RSS

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

## Flash-KMeans:更快更高效的K-Means聚类 一种名为“Flash-KMeans”的新方法,因其显著的速度和内存改进而备受关注。它最初是为了支持视频生成模型而开发的,旨在使*精确*的K-Means——传统上对于大型数据集而言速度较慢的过程——真正可行。 其核心创新“FlashAssign”和“排序反向更新”优化了距离计算和质心更新阶段,绕过了内存瓶颈。这带来了高达17.9倍的加速,优于cuML和FAISS等库(分别快33倍和200倍以上)。 讨论强调,虽然K-Means++侧重于种子选择,但Flash-KMeans改进了核心算法的内部循环。虽然在标准CPU上的收益可能有限,但加速对于GPU加速工作负载尤其重要。该技术建立在类似于“flash attention”的概念之上,并且可能适用于依赖亲和力矩阵的其他算法。

我们检测到您的浏览器已禁用 JavaScript。请启用 JavaScript 或切换到受支持的浏览器以继续使用 x.com。您可以在我们的帮助中心查看受支持的浏览器列表。帮助中心 服务条款 隐私政策 Cookie 政策 版权信息 广告信息 © 2026 X Corp.

## CSS 颜色精度:总结 在进行 CSS 压缩时,深入研究了颜色精度,发现**对于大多数颜色表示,3 位小数(3dp)通常就足够了。** 超过这个数量,人类感知无法区分差异,多余的数字只会浪费字节。 具体来说:对于 Oklch 和 Oklab,建议使用 3dp。对于较旧的 Lab 和 Lch,需要的精度甚至更低。sRGB 表示法(rgb, hsl)和度数等单位通常可以使用整数。这源于“最小可感知差异”(JND)——人类可以检测到的最小颜色变化——以及 Oklab 等现代颜色空间的感知均匀性。 虽然浏览器会以高精度存储颜色,但**压缩器应积极地进行四舍五入**以减小文件大小。 颜色操作的链式处理(例如 `color-mix()`)会放大舍入误差,因此 3dp 比 2dp 更安全。Alpha 值也受益于 3dp,以实现准确的混合。 作者的研究,包括使用 Delta-E 计算进行的广泛测试,表明这些建议在优化文件大小的同时保持了视觉保真度。 这种简化将在 csskit 中实施,并希望被其他压缩器采用。

## Hacker News 讨论摘要:“色彩过多” 一篇 Hacker News 讨论围绕 Keith Cirkel 的文章,探讨了数字应用中色彩精度的出乎意料的影响,尤其是在 CSS 中。核心观点是,看似难以察觉的颜色差异会显著增加文件大小,而一个新的压缩器会调整颜色以优化压缩。 对话分化到几个关键领域:数据精度的重要性(使用 64 位浮点数与 32 位用于准确的位置数据)、人类对颜色差异的感知(“最小可感知差异”或 JND)以及对 Web 开发的实际影响。许多用户使用 Cirkel 的 JND 游戏测试了自己的色彩感知能力,结果出人意料地好,这归功于高质量的显示器。 许多评论者强调了文件大小优化与视觉保真度之间的权衡,质疑在现代网站整体臃肿的情况下,节省是否值得。其他人讨论了色彩准确度的历史背景,以及在看似精确的系统中进行优化的潜力。一个反复出现的主题是,虽然在技术上不同,但许多颜色变化对人眼来说是无法区分的,这引发了对极端精度的必要性的质疑。

客户端挑战:您的浏览器已禁用 JavaScript。请启用 JavaScript 以继续。网站的必要部分无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置所致。请检查您的连接,禁用任何广告拦截器,或尝试使用不同的浏览器。

一场 Hacker News 的讨论集中在人工智能工具的隐私影响上。一篇最近的文章强调,与人工智能分享的信息可能会被利用,这是人工智能时代的“买家自负”。 用户们普遍认为人工智能更像是一种第三方服务,而不是私人笔记本,建议不要输入敏感数据。讨论延伸到本地人工智能模型与云端服务的安全性,一些人更倾向于本地选项以保护隐私。 一些评论员表达了对剥削性技术实践的更广泛担忧,将“以人为本”的技术与当前的产品进行对比。另一些人指出,根据浏览器和广告拦截器的使用情况,广告体验各不相同。最后,有人表示担忧人工智能主要通过就业岗位流失和加强监控来损害工人阶级。

## drawvg:FFmpeg 中的矢量图形 `drawvg` 是一个 FFmpeg 滤镜(自 8.1 版本起可用),它使用其自身语言 VGS 编写的脚本,直接在视频帧上渲染矢量图形。VGS 的设计注重简洁性和易用性,灵感来自 Magick Vector Graphics 和 SVG 路径,语法类似于 TCL 或 shell 脚本。 VGS 利用 Cairo 库进行栅格化,并允许通过 FFmpeg 表达式创建动态图形——从而实现基于帧尺寸、元数据甚至像素颜色的效果。 示例展示了 `drawvg` 的多功能性:创建进度指示器、利用 `cropdetect` 元数据绘制裁剪区域、构建自定义过渡效果(如圆形裁剪或 alpha 合并)、通过读取像素颜色应用像素化效果,以及与 `displace` 滤镜结合生成波浪效果。一个专门的 Playground 提供了更多展示 VGS 功能的示例。`drawvg` 提供了一种强大的方法,可以在 FFmpeg 工作流程中添加自定义视觉元素和效果。

## Drawvg:FFmpeg 的一个用于矢量图形的新滤镜 一个新的滤镜 `drawvg` 已被添加到 FFmpeg 中,允许直接在视频流上绘制矢量图形。这对于遮蔽视频中的元素特别有用——一位用户专门用它来遮盖科技教程中的演讲者叠加层,认为传统的像便签纸这样的方法不方便。 与仅限于矩形的旧滤镜不同,`drawvg` 可以处理圆形等形状,使用简单的内联语法或外部 `.vgs` 文件定义。该滤镜的灵感来自 SVG 路径语法,甚至与“海龟图形”具有概念上的渊源。 讨论强调了未来与机器学习模型集成以实现自动化任务(如面部审查)的可能性,但也指出最近更新导致 FFmpeg 二进制文件大小显著增加。用户正在探索像 mpv 这样的替代方案以获得类似效果,并且一些用户正在利用像 `yt-dlp` 和 FFmpeg 这样的工具来处理 iPad 视频,因为平台存在限制。虽然功能强大,但 FFmpeg 复杂的命令行语法仍然对一些人来说是一个挑战,促使他们使用脚本和 LLM 来管理滤镜配置。

自由软件基金会欧洲分会(FSFE)与长期支付提供商Nexi的合同突然终止,影响了超过450名定期捐助者。Nexi在未提前通知的情况下,停止了所有自动信用卡和直接借记捐款。 此次中断源于FSFE拒绝向Nexi提供敏感的支持者数据——具体来说是用户名和密码,Nexi以“风险分析”为由提出要求。尽管FSFE作为客户已有15年,并提供了大量的财务文件,但FSFE认为该要求不可接受且缺乏明确的理由。随后,Nexi以未能按时遵守数据请求为由取消了合同,而FSFE声称从未收到过该截止日期。 FSFE正在过渡到新的支付提供商,但现有的定期捐款不会自动转移。受影响且尚未收到通知邮件的支持者,被敦促联系FSFE以重新建立他们的捐助。该组织强调,持续的支持对其为软件自由而努力的工作至关重要。

自由软件基金会欧洲分会 (FSFE) 报告称,他们的前支付提供商 Nexi 在 FSFE 拒绝提供私人支持者数据(特别是用户名和密码)的要求后取消了合同。 这引发了 Hacker News 上的讨论,许多评论员质疑为什么支付处理方需要这些敏感信息,尤其是在密码哈希等现代安全实践下。 几种理论浮出水面:对 PCI 审计要求的误解、过度热衷的 KYC/AML 法规应用,以及意大利(和欧盟)金融机构中官僚主义过度扩张的总体趋势。 一些人推测 Nexi 正在对所有子公司应用标准化的审计流程,而不管组织的性质如何。 这起事件也引发了关于比特币和门罗币等加密货币作为替代方案的益处的讨论,它们提供了一种潜在的解决方案,可以避免对传统支付处理方及其可能存在问题的的数据请求的依赖。 最终,这种情况凸显了对数据隐私的担忧以及组织在用户信息方面面临的日益增长的要求。

## 复活世界上最小的硬盘:东芝MK4001MTD 在21世纪初,闪存存储尚未普及之前,像东芝0.85英寸MK4001MTD(吉尼斯世界纪录认证为当时最小的硬盘)这样的微型硬盘为诺基亚N91等便携设备提供了经济高效的存储方案。这款4GB硬盘使用了一种独特的接口,类似于MMC但并不完全兼容。 最近的一个项目成功地对这款硬盘进行了逆向工程,此前多年来一直有其他人尝试失败。关键在于分析来自原始诺基亚N91的信号,揭示该硬盘使用4位SDIO接口与ATA命令进行通信。 至关重要的是,该项目利用了大型语言模型(LLM),如OpenClaw,来解码协议并为树莓派Pico编写固件,有效地将硬盘连接到USB。虽然速度较慢(约10 MHz),但该硬盘现在可以读取了。所有项目文件——代码、硬件设计和文档——都已在GitHub上公开提供,展示了LLM在硬件逆向工程方面的力量,并为保存这块存储历史提供了途径。

## 为微型硬盘打造读取器 - Hacker News 摘要 Hacker News 上的一场讨论围绕着 Will Whang 的项目,旨在为 1 英寸微型硬盘打造读取器。这种硬盘常见于 21 世纪初的设备,例如诺基亚 N91 手机和佳能相机。该项目涉及对硬盘协议的反向工程。 评论者分享了对这些硬盘及其所用设备的怀旧回忆,强调了它们的惊人坚固性(得益于保护读头用的加速度计)和高质量的 DAC。许多人对这项技术表示着迷,回忆起广泛使用固态存储之前的时代。 讨论的关键点集中在作者使用 OpenClaw(一种人工智能工具)生成固件代码。虽然有些人赞赏其效率,但另一些人认为这降低了反向工程过程的“真实感”和人为元素,更喜欢对整个过程的详细描述——包括对人工智能生成代码的手动改进。这场辩论触及了见证完整、人为驱动的发现之旅与利用人工智能辅助的吸引力。尽管如此,该项目总体上受到赞扬,并被认为记录良好。

## Kin:一种语义版本控制系统 Kin 是一种新的版本控制系统 (VCS),旨在从根本上改善开发者与人工智能交互代码的方式。与 Git 的文件和差异方法不同,Kin 将软件存储为语义实体和关系的图,为开发者和 AI 代理提供精确的上下文。它不是 Git 的包装器或编码助手,而是一个主权 VCS,提供语义操作系统层。 经验证的基准测试表明,Kin 在基于 Git 的探索方面表现明显优于 Git,在 10 个热门仓库中获得 **69/70 次胜利**,**处理时间减少 50%**,AI 使用的 **token 减少 44.6%**。 主要功能包括语义审查(分析影响图,而不仅仅是行差异)、跨重构的身份跟踪和溯源跟踪。Kin 与 Git 互操作,允许导入/导出,但不*需要*它。目前处于公开 alpha 阶段,Kin 支持 TypeScript、JavaScript、Python、Go、Java 和 Rust,并通过模型上下文协议 (MCP) 提供中立于助手的集成接口。 虽然核心功能稳定,但持续开发重点是协调、合并冲突解决和性能优化。

一个名为Kin的新项目,由troyjr4103构建,旨在通过用表示代码实体及其关系的语义图取代Git的文件系统,来提高AI编码代理的效率。作者认为,当前方法迫使AI浪费资源重建代码结构,而Kin提供了一个可以直接查询的图。 初步基准测试在10个仓库中使用Codex CLI显示,Kin赢得了70个测试中的69个,性能提高了50%,并且使用了45%更少的token。该项目目前处于alpha阶段,重点在于透明地说明局限性。 一些评论员指出它与Sem/Weave等现有项目相似,并质疑其广泛使用的准备情况,理由是担心合并冲突解决问题。作者欢迎提问,并在GitHub仓库中发布了完整的测试方法。

自由软件基金会(FSF)收到关于 *Bartz v. Anthropic* 版权诉讼的庭外和解通知,该诉讼涉及使用来自 Library Genesis 等网站的受版权保护的书籍来训练大型语言模型(LLM)。虽然法院最初认为将书籍*用于*训练构成合理使用,但*下载*本身的合法性仍然存在争议——导致一项为版权所有者提供赔偿的和解协议。 FSF 拥有“自由即自由”等作品的版权,这些作品包含在 Anthropic 使用的数据集中。然而,FSF 以自由许可发布作品,允许无需付费使用。他们认为真正的补救措施不是金钱,而是将 LLM *作为自由软件* 发布——包括训练数据、模型配置和源代码——以确保用户自由。 尽管 FSF 是一个小组织,但他们表示,如果就类似案件中的版权或许可侵权采取法律行动,他们会将用户自由作为赔偿的首要考虑因素。

## 太阳磁引擎位于深处 新泽西理工大学物理学家的最新研究确定了太阳11年磁周期——太阳王朝——的源头位于其表面下约20万公里处,靠近一个名为tachocline的分层边界。这项发现基于来自NASA的SOHO、SDO和GONG天文台近三十年的太阳声学数据,为了解太阳如何产生磁场和驱动空间天气提供了更清晰的认识。 研究人员分析了穿过太阳的声波,揭示了迁移的旋转带,反映了在太阳表面看到的“蝴蝶形”太阳黑子活动模式。这些模式起源于tachocline内部,在那里,旋转的急剧变化产生了强大的剪切流,为磁王朝提供动力。 研究结果证实了tachocline在太阳周期中的关键作用,并强调了在空间天气预测模型中纳入其动力学机制的必要性。虽然精确预测仍然是一个挑战,但这项研究为理解我们的太阳,以及银河系中其他恒星的磁活动提供了至关重要的一步。

## 太阳磁引擎被绘制 最近一项物理学研究追踪了太阳磁引擎在太阳表面以下200公里处的运作,为太阳活动提供了新的见解。 这项研究在Hacker News上讨论,重点是磁流体动力学(MHD)流体——导电流体,磁场会在其中诱导电流,产生自发振荡的发电机制。 讨论引发了人们对太阳活动与地震等事件之间潜在联系的兴趣(此前该平台曾对此进行过辩论),以及对更高分辨率太阳图像的需求。 一位评论者开玩笑地建议“无人机拍摄”,承认实现这一目标将面临极端的辐射挑战。 总而言之,该帖子强调了持续努力,以理解驱动我们太阳的复杂过程。

更多

联系我们 contact @ memedata.com