每日HackerNews RSS

## 昔日的回忆:索尼数据光盘机DD-1EX 1992年,作者在一家电子精品店工作时,偶然发现了一批清仓的索尼数据光盘机DD-1EX电子书播放器——原价500美元,现在降价处理。他被吸引,买了一个以及配套的“书籍”(迷你CD)。 这款设备看起来像一个微型笔记本电脑,做工出人意料地好,但最终并不实用。它配备了一个QWERTY键盘用于搜索基于文本的书籍,但缺乏数据保存功能——这是90年代早期技术的局限性。随附的软件,如百科全书和旅游指南,展现了那个时代的面貌,甚至提到了苏联。 有趣的是,CD包含模拟器,允许书籍在电脑上运行。作者已经将这些ISO文件提取并提供下载,并预料到索尼可能会提出删除请求(之前有过*龙穴*内容的经历)。尽管在维基百科时代它们已经过时,但这些文件提供了一个迷人的视角,让我们得以一窥互联网之前的数字出版的被遗忘角落。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 索尼数据Discman (huguesjohnson.com) 14 分,来自 naves 5小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 rwmj 4分钟前 [–] 作者真的应该把这些上传到互联网档案。 模拟器(看起来像是DOS的)包含在光盘上似乎很奇怪: ><fs> 文件 /ddman.exe MS-DOS 可执行文件,MZ for MS-DOS 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Turbopuffer 的十亿级向量搜索 (ANN v3) – 摘要 Turbopuffer 发布了近似最近邻 (ANN) 搜索 v3,能够搜索高达 1000 亿个向量(200TiB 数据),具有高查询速率(>1k QPS)和低延迟(<200ms)。这一成就源于以“第一性原理”为基础的重建,专注于最大化硬件利用率。 架构简单:一个无状态查询层,在对象存储之上进行缓存。 扩展的关键在于解决潜在的瓶颈 – CPU 或带宽。 分析表明,由于向量搜索的算术强度(主要是点积),工作负载是“带宽受限”的。 为了应对这个问题,Turbopuffer 采用了两种技术:**分层聚类** 以缩小搜索空间,以及 **二进制量化** (RaBitQ) 以压缩向量尺寸 16-32 倍。 这使得更多数据能够驻留在更快的内存层级(缓存和 DRAM)中,从而降低带宽需求。 然而,压缩增加了算术强度,最终使系统变为 **计算受限**,需要 CPU 优化(例如利用 AVX-512 指令)。 最后,对于超出单机 SSD 容量的数据集,系统将索引分布在多台存储优化机器上,广播查询并将结果拼接在一起。 这种技术的结合提供了大规模下的经济高效的性能,使 Turbopuffer 能够处理更大的工作负载。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 ANN v3:超过 100B 向量的 200 毫秒 p99 查询延迟 (turbopuffer.com) 9 分,_peregrine_ 1 小时前 | 隐藏 | 过去的 | 收藏 | 3 评论 jascha_eng 19 分钟前 | 下一个 [–] 这确实令人印象深刻。我认为现在的经验法则是,先使用 postgres(pgvector) 进行向量搜索,直到它无法工作,然后再使用 turbopuffer。 _peregrine_ 19 分钟前 | 父级 | 下一个 [–] 听起来是个不错的经验法则!不过,我可能会将“成本”纳入“直到无法工作”的考量中。即使性能不错,pg_vector 的经济性也可能更差,尤其是在多租户场景中,你需要许多小索引(这对于主要在 RAM/SSD 上构建索引的任何向量数据库都适用)。 shayonj 7 分钟前 | 上一个 [–] 非常酷,令人印象深刻! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 竞价实例:云成本优化的历史 竞价实例通过利用空闲的数据中心容量,提供显著的云成本节省(比按需价格低 50-90%)。虽然 AWS 在 2009 年率先采用基于拍卖的系统,但 AWS 于 2017 年转向由供应商管理的定价,根据供需关系平滑价格。Google Cloud 和 Azure 一直使用供应商管理的模式。这种转变具有讽刺意味的是*提高了*平均竞价价格,限制了深度折扣的机会。 研究表明,AWS 积极管理竞价价格,以平衡利用率并引导用户转向不太受欢迎的实例类型。2024 年,Rackspace 恢复了最初的拍卖模式,并提供完全透明度,允许竞标直接影响价格。 这种演变凸显了一个关键的矛盾:真正由市场驱动的定价与供应商控制之间的矛盾。虽然拍卖提供了更大的潜在节省,但它们需要透明度。了解每个供应商的方法——以及潜在的机制——对于最大限度地提高成本效益并避免意外中断至关重要。选择合适的供应商和策略将直接影响您的云支出。

## Rackspace Spot 实例分析 - Hacker News 总结 最近 Hacker News 上讨论了 Rackspace Spot,该提供商最初专注于 Kubernetes 集群,现在提供虚拟机。用户称赞其透明度和低廉的价格,有人报告一个演示 Kubernetes 服务的成本为每月 14 美元(Spot 实例 4 美元,负载均衡器 10 美元,控制平面免费)。 然而,讨论表明 Rackspace Spot 并非*总是*最便宜的选择。虽然计算资源有最低价格(根据数据中心年龄,为每小时 0.001-0.01 美元),且竞价仅限于每小时 0.005 美元递增,但负载均衡器(每月 10 美元)和按需实例等其他服务的价格与其他云提供商具有竞争力(2 vCPU/4GB RAM 实例约为每月 27 美元)。 一个可用于生产的配置很容易花费 77 美元以上,从而抵消了 Spot 实例的节省。 普遍的观点是 Rackspace Spot 强调低计算成本的营销可能具有误导性,其价值主张取决于工作负载是否真正受益于可中断的计算资源。 几位用户还注意到在移动 Safari 和 Firefox 上链接文章存在渲染问题。

## 船舶警报疲劳损害海上安全:最新研究 劳埃德船级社(LR)的最新研究表明,过多的船上警报正在导致船员产生“警报疲劳”,从而*降低*海上安全。该研究分析了11艘船超过2000天、4000万个警报事件的数据,发现许多船只每天产生数千个警报,其中很多缺乏实际操作价值。 这种过载会扰乱休息,削弱对安全系统的信任,并导致船员沉默或绕过警报——使不安全做法正常化。少于一半的船只达到推荐的警报速率,有些船只在十分钟内经历超过4600个警报的峰值。 然而,一艘邮轮上的试点项目表明,在六个月内,通过使用现有的工程解决方案(如传感器更换和系统调整)将警报数量减少了近50%。解决10个最频繁的警报可以减少近40%的整体警报负荷。 LR提倡客观的警报性能评估、以人为本的设计以及一致的监管标准,将警报系统从危害转化为安全资产。

劳埃德船级社(lr.org)的一份最新报告强调了海上日益增长的安全隐患:**警报超载**。船员们正被数千个警报淹没,降低了他们的效率,并可能损害安全。 这个问题并不局限于海运业。评论员指出,航空业(引用法国航空447航班事故)和数据库系统也存在类似问题,其中一个问题会引发一连串警报。现代汽车也面临同样困境,众多驾驶辅助系统会产生频繁且常常不必要的警告,导致驾驶员沮丧或麻痹。 核心问题在于,过多的警报会使人员迟钝,难以识别和响应*关键*警报。船员甚至会被从必要的休息中抽调出来处理非必要的通知,进一步加剧了问题。正如一位评论员所指出的,根本原则是“当所有事情都很重要时,就没有什么重要了”。

``` let config = BonsplitConfiguration( allowSplits: true, allowCloseTabs: true, allowCloseLastPane: false, autoCloseEmptyPanes: true, contentViewLifecycle: .keepAllAlive, newTabPosition: .current) let controller = BonsplitController(configuration: config) ```

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 展示 HN: Bonsplit – macOS原生应用的标签和分割 (alasdairmonk.com) 14 分,sgottit 发表于 1小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 jofzar 发表于 17分钟前 [–] 不知道为什么,我以为这会为所有基础的macOS应用提供沙盒风格的标签/分割支持。这很酷,但不知为何对一个我不知道自己想要的东西感到失望。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

## 中央镇,宾夕法尼亚州:从火灾与忽视中重生的城镇 一篇最近发表在《阿特拉斯隐秘》上的文章回顾了宾夕法尼亚州中央镇,这个自1962年煤矿火灾以来一直地下燃烧的臭名昭著的城镇。Hacker News上的讨论揭示了一个关于经济衰退、政治失误和环境灾难的复杂故事。 虽然近年来可见的烟雾减少了,但中央镇仍然是其他衰败的宾夕法尼亚煤矿小镇可能面临的严峻例子。许多评论员指出资源开采经济不可持续的本质,并批评政治上对煤炭的持续支持,尽管它屡次失败。 这种情况凸显了管理不善的历史——如果资金充足,火灾本可以在早期得到控制,但政治因素导致其升级,最终迫使城镇疏散。现在,一家公司已经购买了这片土地,引发了人们对未来煤炭开采以及剩余居民是否会受益的猜测。 讨论还涉及文章本身的一些不准确之处,包括关于爱沙尼亚农田面积的巨大错误,这引发了对事实核查的质疑。最终,中央镇的故事是一个警示,关于优先考虑短期经济利益而忽视环境和社区福祉的长期后果。

## Veritensor:AI供应链零信任安全 Veritensor 是一款安全工具,旨在通过验证 AI 模型的**安全性、真实性和合规性**来保护 AI 供应链。与传统杀毒软件不同,它深入分析 AI 特定格式,如 Pickle、PyTorch、Keras 和 GGUF,通过与 Hugging Face 等注册表的密码学验证,识别恶意代码(RCE、注入)和篡改。 主要功能包括**深度静态分析**(反编译字节码以查找隐藏攻击)、**许可证防火墙**(阻止具有限制性许可证的模型)以及通过与 Sigstore Cosign 集成,对 Docker 容器进行签名,从而实现**供应链安全**。 Veritensor 可以无缝集成到 CI/CD 管道(GitHub Actions、GitLab、pre-commit),并提供通过 PyPI 和 Docker 进行灵活部署的选项。它提供 SARIF 和 SBOM 等格式的详细报告,并允许通过 `veritensor.yaml` 配置文件自定义安全策略。 定期签名更新可确保最新的威胁检测。

## Hugging Face 模型安全扫描总结 一名开发者创建了 **Veritensor**,一个用于扫描人工智能模型潜在安全问题和许可问题的 CLI 工具,其动机是加载模型权重时存在远程代码执行 (RCE) 的风险。他们扫描了 2,500 个 Hugging Face 模型,发现 **86 个存在问题**,分类如下: * **损坏的文件 (16):** Git LFS 指针被误认为是二进制文件。 * **隐藏的许可协议 (5):** 非商业许可协议嵌入在模型头文件中。 * **影子依赖 (49):** 模型尝试导入未安装的库。 * **可疑代码 (11):** 使用诸如 `STACK_GLOBAL` 之类的技术,可能表明隐藏的恶意软件(主要在较旧的 numpy 文件中)。 * **扫描错误 (5):** 缺少本地依赖导致无法加载。 Veritensor 不同于简单的正则表达式扫描器,它通过 *模拟* 数据加载(不执行)并使用哈希值与 Hugging Face 的版本验证文件完整性。它还检查元数据中的许可限制,并可以对容器进行签名以增加安全性。 该工具支持 PyTorch、Keras 和 GGUF,可在 PyPI 上获取 (`pip install veritensor`),扫描数据在 GitHub 上公开可用 ([https://github.com/ArseniiBrazhnyk/Veritensor](https://github.com/ArseniiBrazhnyk/Veritensor))。 正在征求反馈,并讨论现有的解决方案,如 SafeTensors,以及对扫描标志进行更精细控制的必要性。

## xdgctl:一个用于XDG默认应用程序的TUI `xdgctl` 是一个基于终端的用户界面 (TUI),使用 C (GLib/GIO & termbox2) 构建,用于轻松管理 XDG 默认应用程序。它提供了一种便捷的方式来查看和设置各种文件类别的默认程序(如浏览器、文本编辑器),而无需直接使用命令行 `xdg-mime`。 导航使用箭头键 – 上/下用于类别/应用程序,右/Tab 切换到应用程序列表,左返回。按下 Enter 将选定的应用程序设置为当前类别的默认应用程序。 要安装,克隆 GitHub 仓库 ([https://github.com/mitjafelician/xdgctl](https://github.com/mitjafelician/xdgctl)),然后 `make` 和 `make install`。确保已安装开发库,如 `glib-2.0` 和 `gio-2.0`。 请记住,在添加新的 `.desktop` 文件后运行 `update-desktop-database`,默认值存储在 `~/.config/mimeapps.list` 中。`xdgctl` 简化了对桌面环境应用程序关联的管理。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 展示 HN:用于管理 XDG 默认应用程序的 TUI (github.com/mitjafelicijan) 6 分,作者 mitjafelicijan 1 小时前 | 隐藏 | 过去 | 收藏 | 3 条评论 作者在此。我制作了这个小 TUI 程序,用于管理 Linux 桌面上的默认应用程序。也许对你们中的一些人有用。 很高兴回答任何问题。 cda2100 10 分钟前 | 下一个 [–] 你用感觉编写了一个 TUI 来设置一些环境变量? 现在每个展示 HN 都是这样吗? 回复 JonAtkinson 2 分钟前 | 父评论 | 下一个 [–] 你有什么资格告诉别人为什麽感到自豪,以及想要分享什麽? 回复 untech 10 分钟前 | 上一个 [–] 看起来不错! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

(Empty input provided. There is nothing to translate.)

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 在月球上放石头 (ahwoo.com) 19 分,作者 epaga 15 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 kykat 5 小时前 [–] 那些小石头会碰撞吗?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 视线:地理空间基础设施情报 视线是一个利用OpenStreetMap (OSM)数据来发现和分析现实世界基础设施的平台。它允许用户搜索、监控和分析诸如电信塔、发电厂、数据中心等资产,并利用带有地图视图和搜索过滤器的前端界面。 后端通过一系列模块处理搜索:路由处理程序、自然语言解析器、通过Nominatim进行地理坐标查找、查询Overpass API以获取OSM数据,以及用于提高性能的缓存。所有数据均来自众包的OSM项目,承认可能存在不准确之处。 视线支持各种搜索参数,包括资产*类型*、*运营商*、*区域*和邻近搜索。它使用React和TypeScript构建,并利用Leaflet.js进行地图显示。 **重要注意事项:** 用户必须遵守OSM对Nominatim和Overpass API的使用政策,避免过度查询并尊重数据限制。该工具仅用于信息目的,关键数据应始终通过官方来源进行验证。

## 视线:物理世界的 Shodan 视线是一个新的开源搜索引擎,构建方式类似于 Shodan,但用于*物理*基础设施。它不扫描互联网,而是利用 OpenStreetMap (OSM) 数据来定位现实世界的资产。 用户可以通过位置(例如“法国巴黎的数据中心”)或结构化查询(例如 `type:telecom operator:airtel`)搜索电信塔、发电厂和数据中心等基础设施。 视线利用 Overpass API 获取 OSM 数据,并使用 Nominatim 进行位置解析,优先考虑确定性解析而非 AI 驱动的推断。该项目避免了硬编码的地理限制,提供灵活的搜索体验。 您可以在 GitHub 上探索视线及其代码:[https://github.com/ni5arga/sightline](https://github.com/ni5arga/sightline),并在以下网址试用:[https://sightline-maps.vercel.app](https://sightline-maps.vercel.app)。

更多

联系我们 contact @ memedata.com