## Vortex:下一代列式文件格式
Vortex 是一种高性能、开源的列式文件格式,专为与对象存储的快速数据处理而设计。它在 Linux 基金会的支持下开发,旨在成为可用速度最快、可扩展性最强的格式,与 Parquet 相比,提供 **100 倍更快的随机读取和 10-20 倍更快的扫描速度**。
主要特性包括:**可扩展的架构**,基于 Apache DataFusion 构建;**与 Apache Arrow 的零拷贝兼容性**;以及 **逻辑/物理分离**,实现灵活的数据处理。Vortex 支持一系列 **可插拔的编码和压缩策略**,包括级联压缩以优化存储。
该文件格式自 0.36.0 版本以来已被认为是稳定的,并保证了向后兼容性。它与流行的工具(如 **Arrow、DataFusion、Spark、Pandas 和 Polars**)集成,并且很快将支持 Iceberg。
用户可以使用 `vx` 命令行工具探索 Vortex 文件,并根据 Apache-2.0 许可为该项目做出贡献。
网络有一种超能力:无需许可的链接共享。我发送给你一个链接,只要你有一个代理,即浏览器(或仅仅是一个HTTP客户端),你就可以访问该链接的内容。在当今平台的背景下,创建和传播链接的能力几乎是激进的。有些人认为超链接很危险,必须加以控制:然而,我们仍然在链接:链接到我们想要的一切(👋 Apple),无论多少次(👋 Meta),并且不期望任何回报(👋 Google/Open AI)。为什么?因为这是一个网络。互联互通是整个目的。链接构成了整体。没有链接,就没有整体。没有链接意味着没有网络,只有孤岛。隔离。缺乏连接。颠覆现状。拥有一个网站。创建和分享链接。
Meta 发布了 SAM 3D,一套新的 AI 模型,能够将 2D 图像转换为对物体、场景和人体的详细 3D 重建。这包括 SAM 3D Objects 和 SAM 3D Body,两者均达到了最先进的性能。 Meta 同时分享了检查点、推理代码,以及即将推出的 SA-3DAO 数据集——一个用于逼真 3D 重建的全新挑战性基准。可访问性是关键,Meta 启动了“Segment Anything Playground”,允许任何人轻松地试验这些模型,并从自己的图像生成 3D 重建。 此次发布还包括 SAM 3,一个更新的基础模型,用于改进图像和视频理解。这些进步已经集成到 Meta 产品中,例如 Facebook Marketplace 的“在房间中查看”功能,并旨在促进研究、创意项目和交互式应用方面的创新。
## Tyr:适用于 Arm Mali GPU 的高性能 Rust 驱动程序
Tyr,一个为 Arm Mali GPU 设计的 Rust 驱动程序,正在快速开发中。虽然上游代码尚未完全准备就绪,但下游原型已经展示了显著的功能——实现了与现有 C 驱动程序相当的性能。
最初,Tyr 的重点是建立用户模式和内核模式驱动程序(UMD 和 KMD)之间的通信。现在,它能够成功执行 GPU 任务,运行完整的 GNOME 桌面环境(包括 Weston),甚至可以运行 SuperTuxKart 等 3D 游戏。关键里程碑包括成功提交简单任务、渲染旋转立方体,并最终运行复杂的应用程序。
这个在 Rock 5B 板上测试的原型证明了 Rust 在构建高性能 GPU 内核驱动程序方面的可行性。虽然它尚未稳定到可以日常使用,但它为正在进行的上游开发和 Rust 抽象的实验提供了一个重要的测试平台。该项目最终目标是将 Tyr 完全集成到上游,为现代、安全和高性能的 GPU 驱动程序生态系统铺平道路。
## TopHat 与令人惊讶的 Wi-Fi 定位世界 华盛顿大学的算法导论课程使用 TopHat 记录出勤,不仅仅是简单的代码输入,而是利用设备地理位置进行“安全出勤”。 这引发了一项调查,以了解 TopHat *如何*确定位置,结果显示它比基本的 IP 地址跟踪精确得多。 它不是 IP 地理位置定位——后者常常不准确——而是浏览器的地理位置 API。 该 API 严重依赖于 **Wi-Fi 定位系统 (WPS)**。 在获得许可时,您的浏览器会识别周围的 Wi-Fi 网络(SSID 和唯一的 BSSID/MAC 地址),并将此数据发送给 Google 等提供商。 这些提供商会将此数据与通过“测绘驾驶”(通过 GPS 绘制 Wi-Fi 网络)和不断报告网络位置的设备用户数据构建的大型众包数据库进行交叉引用。 这个系统虽然方便,但也引发了隐私问题。 历史上,数据曾被滥用(例如 Google 捕获未加密数据),并且存在跟踪个人的漏洞。 虽然公司提供退出选项,但大多数设备默认共享此数据。 像 [Wigle.net](https://wigle.net/) 和 [beacondb.net/](https://beacondb.net/) 这样的资源展示了这种数据收集的规模,并提供了对 Wi-Fi 地理位置的替代视角。 最终,准确的位置跟踪依赖于一个令人惊讶的协作——并且常常在不知情的情况下贡献——的数据网络。
作者计划将他们的游戏电脑从Windows 11更换为Linux,具体来说是基于Arch的、为游戏优化的CachyOS发行版。尽管他们与Windows有着悠久的历史,并且最近的Linux经验有限,但他们对微软的发展方向越来越不满——例如Copilot等不需要的功能、强制更新以及向AI集成的转变。 最近的进展,特别是Valve在Steam Deck上的工作,使得在Linux上玩游戏越来越可行。像Bazzite这样的发行版甚至在游戏掌机上表现优于Windows。虽然作者承认可能会遇到设置问题,并且Linux游戏市场份额仍然很小(目前Steam用户中大约为3%),但他们认为现在是时候尝试一下了。 他们有备用机器用于工作,并且愿意花空闲时间来解决问题,即使切换过程不顺利,他们也认为学习经验是值得的。最终,他们希望获得一个更简洁、以用户为中心的操作系統,并且对Linux成为可行的桌面选择持乐观态度,至少对于他们自己的设置而言。
## 质数的探寻与卢卡斯的巧妙解法 质数——只能被1和自身整除的数——几个世纪以来一直令数学家着迷。然而,确定一个大数是否为质数却是一项重大挑战。在19世纪,爱德华·卢卡斯着手解决证明39位数170,141,183,460,469,231,731,687,303,715,884,105,727是质数的问题,这发生在计算机出现之前。 卢卡斯专注于*梅森素数*——形式为2<sup>p</sup> – 1的数(其中p是质数)。虽然并非所有这样的数都是质数,但它们提供了一个潜在的调查途径。他发展了*卢卡斯-莱默素性测试*,这是一种比试除法计算量小得多的方法。该测试涉及一个特定的序列和检查可除性,巧妙地利用了有限数域内的对称性——这一概念由埃瓦里斯特·伽罗瓦率先提出。 卢卡斯的方法不是测试所有较小质数的除法,而是专注于计算序列中的项并检查其是否能被梅森数整除。尽管序列中的数字增长迅速,但巧妙地使用余数可以使计算保持在可控范围内。卢卡斯成功地证明了2<sup>127</sup> – 1是质数,这一壮举在没有计算机辅助的情况下几十年无人能及。该测试后来由德里克·莱默完全证明,因此得名。
## WhatsApp 隐私漏洞暴露 35 亿账户 维也纳大学和 SBA Research 的研究人员发现 WhatsApp 的联系人发现功能存在重大隐私漏洞,导致超过 35 亿用户账户(遍布 245 个国家/地区)的信息被枚举。他们利用设计用于通过电话号码匹配用户的系统,能够以每小时超过 1 亿个号码的速度查询 WhatsApp 的基础设施。 这项研究已负责任地披露给 Meta 并已得到缓解,揭示了公开可用的数据,例如电话号码、公钥和个人资料信息——足以推断用户操作系统、账户年龄和设备连接。它还强调了 WhatsApp 在应用程序被禁止的国家/地区的使用情况,并确定了之前数据泄露中号码的持续暴露。 重要的是,消息内容仍然加密,但该研究强调了与元数据收集相关的隐私风险。研究结果强调了持续的安全研究以及研究人员和行业之间积极合作的必要性,以保护集中式消息传递平台中的用户隐私。完整研究将在 2026 年 NDSS Symposium 上展示。