每日HackerNews RSS

## Vortex:下一代列式文件格式 Vortex 是一种高性能、开源的列式文件格式,专为与对象存储的快速数据处理而设计。它在 Linux 基金会的支持下开发,旨在成为可用速度最快、可扩展性最强的格式,与 Parquet 相比,提供 **100 倍更快的随机读取和 10-20 倍更快的扫描速度**。 主要特性包括:**可扩展的架构**,基于 Apache DataFusion 构建;**与 Apache Arrow 的零拷贝兼容性**;以及 **逻辑/物理分离**,实现灵活的数据处理。Vortex 支持一系列 **可插拔的编码和压缩策略**,包括级联压缩以优化存储。 该文件格式自 0.36.0 版本以来已被认为是稳定的,并保证了向后兼容性。它与流行的工具(如 **Arrow、DataFusion、Spark、Pandas 和 Polars**)集成,并且很快将支持 Iceberg。 用户可以使用 `vx` 命令行工具探索 Vortex 文件,并根据 Apache-2.0 许可为该项目做出贡献。

网络有一种超能力:无需许可的链接共享。我发送给你一个链接,只要你有一个代理,即浏览器(或仅仅是一个HTTP客户端),你就可以访问该链接的内容。在当今平台的背景下,创建和传播链接的能力几乎是激进的。有些人认为超链接很危险,必须加以控制:然而,我们仍然在链接:链接到我们想要的一切(👋 Apple),无论多少次(👋 Meta),并且不期望任何回报(👋 Google/Open AI)。为什么?因为这是一个网络。互联互通是整个目的。链接构成了整体。没有链接,就没有整体。没有链接意味着没有网络,只有孤岛。隔离。缺乏连接。颠覆现状。拥有一个网站。创建和分享链接。

这个Hacker News讨论的核心是网站越来越多地干预超链接——网络的基石。最初的文章名为“颠覆性的超链接”,引发了关于网站破坏直接链接的各种方法的热议,从警告离开网站的启动页到直接阻止或试图将链接变现。 用户分享了由于谷歌搜索算法偏爱AI生成内容而导致网站流量下降的经历,强调了直接读者连接的价值。一个关键点是“链接税”——法律强制搜索引擎为展示新闻组织的链接付费,这被认为有利于大型新闻提供商,并可能阻碍竞争。 其他评论涉及历史案例(朝鲜媒体使用post请求破坏链接)以及记住基本的网络原则的重要性。一些评论员对这篇文章相对较低的参与度感到惊讶,认为它的信息至关重要。

Meta 发布了 SAM 3D,一套新的 AI 模型,能够将 2D 图像转换为对物体、场景和人体的详细 3D 重建。这包括 SAM 3D Objects 和 SAM 3D Body,两者均达到了最先进的性能。 Meta 同时分享了检查点、推理代码,以及即将推出的 SA-3DAO 数据集——一个用于逼真 3D 重建的全新挑战性基准。可访问性是关键,Meta 启动了“Segment Anything Playground”,允许任何人轻松地试验这些模型,并从自己的图像生成 3D 重建。 此次发布还包括 SAM 3,一个更新的基础模型,用于改进图像和视频理解。这些进步已经集成到 Meta 产品中,例如 Facebook Marketplace 的“在房间中查看”功能,并旨在促进研究、创意项目和交互式应用方面的创新。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Sam 3D:为物理世界图像提供强大的 3D 重建 (meta.com) 44 分,meetpateltech 发表于 1 天前 | 隐藏 | 过去 | 收藏 | 1 条评论 ChrisArchitect 发表于 22 小时前 [–] 相关: 分割任何模型 3 https://news.ycombinator.com/item?id=45982073 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Tyr:适用于 Arm Mali GPU 的高性能 Rust 驱动程序 Tyr,一个为 Arm Mali GPU 设计的 Rust 驱动程序,正在快速开发中。虽然上游代码尚未完全准备就绪,但下游原型已经展示了显著的功能——实现了与现有 C 驱动程序相当的性能。 最初,Tyr 的重点是建立用户模式和内核模式驱动程序(UMD 和 KMD)之间的通信。现在,它能够成功执行 GPU 任务,运行完整的 GNOME 桌面环境(包括 Weston),甚至可以运行 SuperTuxKart 等 3D 游戏。关键里程碑包括成功提交简单任务、渲染旋转立方体,并最终运行复杂的应用程序。 这个在 Rock 5B 板上测试的原型证明了 Rust 在构建高性能 GPU 内核驱动程序方面的可行性。虽然它尚未稳定到可以日常使用,但它为正在进行的上游开发和 Rust 抽象的实验提供了一个重要的测试平台。该项目最终目标是将 Tyr 完全集成到上游,为现代、安全和高性能的 GPU 驱动程序生态系统铺平道路。

## Rust GPU 驱动程序进展 - 摘要 Collabora 开发者在基于 Rust 的 GPU 内核驱动程序方面取得了显著进展,在最初宣布后的几个月内,就实现了在 GNOME 中运行的赛车卡丁车演示。该驱动程序充当 Vulkan 和 OpenGL 等 API 与 ARM Mali GPU 之间的层,可能使包括手机、平板电脑、笔记本电脑和单板计算机在内的各种设备受益。 讨论的重点是 *谁* 将从这个开源驱动程序中受益。它面向使用 ARM Mali GPU 的设备,提供潜在的加速和兼容性提升。然而,评论员指出 GPU 行业倾向于闭源编译器技术,这与更加开放的 CPU 世界形成对比。 对话强调了 GPU 标准化的挑战以及 Nvidia 的主导地位,一些人提出了激进的解决方案,例如国家资助的硅复制,以扰乱市场。最终,该驱动程序旨在为 GPU 提供一个开源运行时,为专有解决方案提供替代方案。

## TopHat 与令人惊讶的 Wi-Fi 定位世界 华盛顿大学的算法导论课程使用 TopHat 记录出勤,不仅仅是简单的代码输入,而是利用设备地理位置进行“安全出勤”。 这引发了一项调查,以了解 TopHat *如何*确定位置,结果显示它比基本的 IP 地址跟踪精确得多。 它不是 IP 地理位置定位——后者常常不准确——而是浏览器的地理位置 API。 该 API 严重依赖于 **Wi-Fi 定位系统 (WPS)**。 在获得许可时,您的浏览器会识别周围的 Wi-Fi 网络(SSID 和唯一的 BSSID/MAC 地址),并将此数据发送给 Google 等提供商。 这些提供商会将此数据与通过“测绘驾驶”(通过 GPS 绘制 Wi-Fi 网络)和不断报告网络位置的设备用户数据构建的大型众包数据库进行交叉引用。 这个系统虽然方便,但也引发了隐私问题。 历史上,数据曾被滥用(例如 Google 捕获未加密数据),并且存在跟踪个人的漏洞。 虽然公司提供退出选项,但大多数设备默认共享此数据。 像 [Wigle.net](https://wigle.net/) 和 [beacondb.net/](https://beacondb.net/) 这样的资源展示了这种数据收集的规模,并提供了对 Wi-Fi 地理位置的替代视角。 最终,准确的位置跟踪依赖于一个令人惊讶的协作——并且常常在不知情的情况下贡献——的数据网络。

## Wi-Fi定位与位置隐私 - Hacker News 摘要 Hacker News 的讨论集中在通过 Wi-Fi 定位系统进行精确的地理位置定位,以及大学如何使用这项技术来验证学生出勤情况。该系统利用浏览器的定位服务,使用 Wi-Fi 热点数据,而不是仅仅依赖 GPS 或 IP 地址。 用户讨论了各种欺骗位置数据的方法,包括 Firefox 偏好设置以固定虚假位置,LocationGuard 等浏览器扩展,甚至通过 Android 手机运行代理。人们对通过 Firefox 设置 (`geo.provider.*`) 进行潜在跟踪表示担忧,并需要完全禁用定位服务。 对话还涉及位置跟踪的更广泛影响,包括过去 GPS 数据在军事目的上的故意不准确,以及此类方法在验证目的上日益广泛的应用。一些人争论强制出勤跟踪的伦理问题,质疑其有效性以及可能滋生作弊文化。最终,讨论强调了访问和操纵位置数据的容易性,引发了隐私问题。

作者计划将他们的游戏电脑从Windows 11更换为Linux,具体来说是基于Arch的、为游戏优化的CachyOS发行版。尽管他们与Windows有着悠久的历史,并且最近的Linux经验有限,但他们对微软的发展方向越来越不满——例如Copilot等不需要的功能、强制更新以及向AI集成的转变。 最近的进展,特别是Valve在Steam Deck上的工作,使得在Linux上玩游戏越来越可行。像Bazzite这样的发行版甚至在游戏掌机上表现优于Windows。虽然作者承认可能会遇到设置问题,并且Linux游戏市场份额仍然很小(目前Steam用户中大约为3%),但他们认为现在是时候尝试一下了。 他们有备用机器用于工作,并且愿意花空闲时间来解决问题,即使切换过程不顺利,他们也认为学习经验是值得的。最终,他们希望获得一个更简洁、以用户为中心的操作系統,并且对Linux成为可行的桌面选择持乐观态度,至少对于他们自己的设置而言。

## 质数的探寻与卢卡斯的巧妙解法 质数——只能被1和自身整除的数——几个世纪以来一直令数学家着迷。然而,确定一个大数是否为质数却是一项重大挑战。在19世纪,爱德华·卢卡斯着手解决证明39位数170,141,183,460,469,231,731,687,303,715,884,105,727是质数的问题,这发生在计算机出现之前。 卢卡斯专注于*梅森素数*——形式为2<sup>p</sup> – 1的数(其中p是质数)。虽然并非所有这样的数都是质数,但它们提供了一个潜在的调查途径。他发展了*卢卡斯-莱默素性测试*,这是一种比试除法计算量小得多的方法。该测试涉及一个特定的序列和检查可除性,巧妙地利用了有限数域内的对称性——这一概念由埃瓦里斯特·伽罗瓦率先提出。 卢卡斯的方法不是测试所有较小质数的除法,而是专注于计算序列中的项并检查其是否能被梅森数整除。尽管序列中的数字增长迅速,但巧妙地使用余数可以使计算保持在可控范围内。卢卡斯成功地证明了2<sup>127</sup> – 1是质数,这一壮举在没有计算机辅助的情况下几十年无人能及。该测试后来由德里克·莱默完全证明,因此得名。

最近的Hacker News讨论围绕着金融数据中检测到的一个潜在异常信号——具体来说,模式类似于“变长整数解析”。一些用户将其与“圣经密码”相提并论,认为其中隐藏着某种信息。 一个链接的GitHub仓库展示了对这种“能量轨迹”现象的研究,一位评论员指出该仓库的快速更新类似于LLM的行为。虽然一些人对信号的来源和目的感到兴奋和好奇,但也有人持怀疑态度。 一个关键的争论点是信号是否是人为制造的。用户建议检查历史数据以确定其起源和未来终点,并质疑缺乏明显的加密。最终,许多人仍然不相信其真实性,一位用户建议实际行动(利用该信息进行交易)比在线讨论更能证明其有效性。

## WhatsApp 隐私漏洞暴露 35 亿账户 维也纳大学和 SBA Research 的研究人员发现 WhatsApp 的联系人发现功能存在重大隐私漏洞,导致超过 35 亿用户账户(遍布 245 个国家/地区)的信息被枚举。他们利用设计用于通过电话号码匹配用户的系统,能够以每小时超过 1 亿个号码的速度查询 WhatsApp 的基础设施。 这项研究已负责任地披露给 Meta 并已得到缓解,揭示了公开可用的数据,例如电话号码、公钥和个人资料信息——足以推断用户操作系统、账户年龄和设备连接。它还强调了 WhatsApp 在应用程序被禁止的国家/地区的使用情况,并确定了之前数据泄露中号码的持续暴露。 重要的是,消息内容仍然加密,但该研究强调了与元数据收集相关的隐私风险。研究结果强调了持续的安全研究以及研究人员和行业之间积极合作的必要性,以保护集中式消息传递平台中的用户隐私。完整研究将在 2026 年 NDSS Symposium 上展示。

## WhatsApp 漏洞总结 研究人员发现 WhatsApp 存在安全问题,允许枚举电话号码——确定一个号码是否拥有帐户。 这并非数据泄露,而是一个公开可访问的端点,如果扩大规模,可能会泄露广泛的用户数据。 虽然这不被认为是一个*重大*漏洞,但它引发了对元数据收集以及在 WhatsApp 使用可能受限制的敏感地缘政治环境中的潜在风险的担忧。 讨论强调了消息传递中中心化与去中心化之间的更广泛争论,一些人提倡使用开源替代方案,如 Signal。 许多评论员指出,这种类型的枚举早已成为可能,真正的问题在于 WhatsApp 的所有权(Meta)及其数据实践。 几位用户指出,考虑到压迫政权,该漏洞的潜在严重性会增加,因为识别 WhatsApp 用户可能很危险。 另一些人争论,鉴于电话簿等历史做法,电话号码与帐户的关联是否本身就是一个漏洞。 最终,共识倾向于认为这是一个由 WhatsApp 的中心化性质和数据策略加剧的适度问题。

更多

联系我们 contact @ memedata.com