每日HackerNews RSS

启用 JavaScript 和 Cookie 以继续。

## 用于增强SaaS安全性的分片:摘要 现代SaaS平台面临“全面”数据泄露的风险,影响大量用户。因此,一个关键的安全原则是**爆炸半径降低**——设计系统以限制任何单一泄露的影响。本文重点介绍了**分片**,即将数据划分为分区,作为实现这一目标的关键策略。 分片最初是一种可扩展性技术,现在越来越被认为是安全控制。有效的分片不仅仅是数据*如何*分割,而是*怎样*分割。传统方法按租户、地理位置或产品进行分片。然而,**Mimir的“按用户访问分片”模型**提倡将分片与实际的安全边界对齐——谁被授权查看什么。 该模型采用结构和密码隔离相结合的方式,确保服务器即使被攻破,也永远不会拥有足够的信息来访问超出用户权限的数据。它利用客户端加密和限定在访问域内的密钥,将泄露的影响限制在特定分片。 最终,分片,特别是与零信任原则相结合,将重点从周界安全转移到以数据为中心的保护,将潜在的灾难性泄露转化为有界且可审计的事件。首席信息安全官应根据最大泄露单位以及向审计员展示这些保证的能力来评估其架构。

## SaaS 安全与可扩展性的数据库分片 一则 Hacker News 讨论探讨了在 SaaS 应用中使用每个客户一个专用数据库的做法——即分片。其目的是隔离客户数据,简化合规性、迁移和资源监控,并限制潜在数据泄露的“爆炸半径”。 多位评论者分享了使用这种方法的积极经验,尤其是在使用 Microsoft SQL Server 和 MySQL 时。优点包括更轻松的审计、独立的客户迁移和简单的监控。然而,也存在挑战。在众多数据库(“分片模式漂移”)中保持模式一致性需要强大的自动化和声明式模式管理工具。 管理开销、扩展连接限制和成本优化也是需要考虑的问题。管理配置并将请求路由到正确的数据库会增加复杂性,但现代工具(如集中式授权服务和反向代理)可以缓解这一问题。一些人建议对较小规模的部署使用 SQLite 为每个客户提供服务。最终,讨论强调了虽然分片功能强大,但它需要严格的运维纪律,并不适用于所有情况。

## Common Lisp 加载与系统:总结 Common Lisp 的文件处理和代码加载可能令人困惑,这源于其历史和妥协。标准定义了使用“名称字符串”和“路径名”的基本文件访问,但代码加载依赖于 `LOAD`,其行为在不同实现中有所不同。编译为 `.fasl` 文件可以加速加载,通过预解析代码实现。 除了标准之外,像 ASDF 和 Quicklisp 这样的工具简化了依赖管理。ASDF 定义了“系统”——本质上是库——并处理加载依赖项。系统不是 Lisp 的核心特性,而是一种组织 `LOAD` 和 `COMPILE-FILE` 调用方式。Quicklisp 建立在 ASDF 之上,增加了从互联网下载系统的能力。 重要的是,Common Lisp 使用 **包 (packages)** 作为符号的命名空间,与系统分离。一个好的做法是使用 ASDF 的 `package-inferred-system` 功能,让文件直接定义包,从而简化系统定义。 对于项目设置,将你的代码目录符号链接到 `~/.local/share/common-lisp/source` 允许 ASDF 找到你的系统。Quicklisp 管理外部依赖项,并且像 `~/quicklisp/local-projects` 这样的中心位置可以容纳 Quicklisp 本身中找不到的依赖项。 为了更深入的理解,建议研究 ASDF 和 Quicklisp 的源代码。

这个Hacker News讨论围绕Common Lisp的包和依赖管理。虽然Quicklisp是事实上的标准,但对话强调了它的局限性并探讨了替代方案。ASDF是核心的包加载机制,而Quicklisp充当包装器和管理器。 用户们争论使用Quicklisp与手动使用`curl`下载包并通过ASDF管理它们的优缺点,涉及安全问题(供应链攻击)和版本控制。一些人提倡使用更现代的包管理器,如OCICL或Qlot,来处理版本锁定,这是Quicklisp所缺乏的功能。 一个反复出现的主题是Common Lisp中独特的、有时是过时的命名约定(例如,“system”与“package”)。社区承认生态系统的稳定性通常降低了对严格版本控制的*需求*,但也指出了测试框架的不足。最终,讨论揭示了一个充满活力但有些怪异的生态系统,其中“自己动手”的解决方案很常见,这可能会阻碍更广泛的采用。

受够了谷歌地图上带有偏见的餐厅推荐,数据科学家劳伦·利克构建了一个机器学习模型,分析了大伦敦地区的每家餐厅。这个项目演变成对数字平台如何影响地方经济的调查,揭示了一个“算法市场”,餐厅的可见度极大地影响其成功。 利克的分析表明,谷歌地图不仅仅*反映*受欢迎程度,而是通过排名信号主动*塑造*它——相关性、距离,以及关键的“显著性”(基于评论、品牌认知度和网络可见性)。这为成熟的企业和连锁店创造了累积优势,而新的独立餐厅则面临“冷启动”问题。 为了量化这一点,利克开发了一个模型,根据结构特征预测预期的评分,从而识别出表现高于或低于算法预期的餐厅。这些数据被可视化在一个公共仪表板上,允许用户发现“被低估的瑰宝”。进一步的分析绘制了伦敦的“餐厅生态系统强度”,揭示了烹饪多样性的不均衡分布,通常与移民模式和可负担性相关联。 最终,利克认为像谷歌地图这样的平台拥有巨大的经济影响力,因此有必要对排名算法进行透明化和可审计性,作为地方经济政策问题。

## Google 地图与餐厅可见性:摘要 最近的一项分析探讨了 Google 地图的算法如何影响伦敦的餐饮业,认为它已经超越了简单的目录,成为一个“市场创造者”。作者发现,在 Google 地图上的可见性并非中立,它倾向于成熟的连锁店和高流量区域,因为它们具有累积的认知度和更快的评论生成速度。这形成了一个反馈循环,已经受欢迎的地方变得*更*可见,可能会阻碍独立餐厅的发展。 Hacker News 的评论讨论强调了用户对 Google 地图搜索功能的不满——特别是放大时难以找到商家,以及对 Apple 地图或 OpenStreetMap 更全面列表的偏好。许多评论员也对个性化推荐的下降表示遗憾,将当前的算法与 Google 和 Netflix 早期更量身定制的方法进行了对比。 一个主要关注点是 Google 排名系统的缺乏透明度和可审计性,以及它对公平竞争的潜在影响。一些用户分享了关于评论操纵的经历,以及对平台算法在本地发现中日益增长的依赖,质疑这最终是否会限制选择和创新。 这篇文章引发了关于便利性、算法控制以及支持多元化本地生态系统之间平衡的争论。

## VoxCSS:一个基于CSS的3D体素引擎 VoxCSS是一个轻量级的JavaScript库,使用CSS变换直接在DOM中创建3D体素艺术。它通过堆叠网格层渲染HTML长方体,提供了一种在没有WebGL的情况下构建3D场景的简单方法。 主要特性包括对颜色、纹理、交互控制的支持,以及像剔除和体素合并这样的性能优化。你可以使用体素数组定义场景,指定坐标、形状(立方体、斜坡、楔形、尖峰)、颜色和纹理。 VoxCSS与框架无关,可以与Vue、React、Svelte或纯JavaScript无缝协作。专用的组件,如`<VoxCamera>`和`<VoxScene>`简化了集成。它还包含一个内置的解析器,用于加载MagicaVoxel (.vox) 文件。 性能通过仅渲染可见面,并可选地将相邻体素合并成更大的元素来管理,这对于复杂的场景尤其有益。 了解更多信息并探索示例,请访问[voxcss.com](voxcss.com) 或通过npm安装:`npm install @layoutit/voxcss`。

虽然软件工程缺乏*普适*规则,但许多原则几乎如此——例如,优先使用组合而非继承,或避免冒泡排序。然而,即使是这些“规则”也有例外。令人惊讶的是,冒泡排序,通常被认为效率低下,*可以*是有用的。 对于非常小的数组,冒泡排序优于快速排序等更复杂的算法,使其成为混合排序策略中的潜在优化方案。更独特的是,英伟达的研究表明冒泡排序在特定硬件上具有优势。 然而,其最具吸引力的用例在于游戏开发。冒泡排序快速、易于中断的步骤以及朝着有序状态的稳定进展,非常适合需要严格帧率限制内的增量排序场景——例如,根据距离对渲染对象进行排序,在这种情况下,*一定程度的*排序比没有排序更好。 此外,还存在一个利基应用,用于可视化动画排序过程,尽管更高效的预计算和动画方法可能更受欢迎。 最后,作者强调了对Quanta Magazine关于元复杂性的文章的贡献,该贡献源于对计算困难问题的讨论。

## 冒泡排序:令人惊讶的实用案例 这次Hacker News讨论探讨了臭名昭著的低效冒泡排序算法在某些情况下可能成为可行选择的情景。虽然通常性能不如更高级的排序方法,但由于其简单性和独特属性,冒泡排序在特定领域有应用。 许多评论员强调了它在游戏开发中对小型精灵列表进行排序的用处,优先考虑流畅的动画而非绝对性能。其“随时”算法特性——随着时间的推移提供越来越排序的结果——对于可能被中断的实时系统来说很有价值。 其他用例包括在暴力搜索期间增量排序数据,数据集非常小的情况(在这种情况下,常数因子比大O复杂度更重要),以及资源受限的环境,例如代码大小最小化至关重要的微控制器。有时它也被用作比较其他排序算法的基准。 讨论还涉及理解*何时*理论效率让步于实际考虑因素,例如代码简单性、内存使用情况以及正在排序的数据的特定特征的重要性。

美国国务卿马科·鲁比奥指示所有国务院通讯恢复使用Times New Roman字体,推翻了他前任安东尼·布林肯在2023年将Calibri设为标准字体的决定。布林肯选择Calibri是为了方便视力障碍人士阅读。 鲁比奥认为恢复使用Times New Roman——一种更传统的衬线字体——有助于提升“专业”形象,并称Calibri是一种“浪费”的多元化举措。这项变化于12月10日生效,反映了特朗普政府更广泛地撤销政府内部多元化、公平和包容性计划的努力。 Calibri的设计师卢卡斯·德格鲁特表达了既好笑又失望的心情,指出该字体是专门为现代屏幕可读性而设计的。国务院发言人将此次更改解释为旨在呈现“统一、专业的形象”,这与最近的一些决定如出一辙,例如用纪念特朗普总统生日取代了马丁·路德·金日和解放日免费入园活动。

## 对 Gemini 3 Pro 付费的沮丧 作者尝试使用 Google 的 Gemini 3 Pro 为新的 React 项目进行 LLM 辅助编码,希望自动化样板代码。然而,仅仅*付费*获取访问权限就出乎意料地困难。 Google 支离破碎的“Gemini”生态系统——包括聊天机器人、应用程序、AI 功能以及 Gemini Code Assist、Jules 和 Antigravity 等多种编码工具——立即造成了困惑。与 Anthropic 和 OpenAI 简单的支付选项不同,Google 缺乏一个明确的“立即购买”按钮来获取其编码助手。 这个过程涉及浏览迷宫般的 Google Cloud Console,创建结算帐户,用照片 ID 验证身份(具有特定且未说明的文件格式要求),并忍受多个验证步骤。即使在成功关联支付方式后,访问最初也被 403 错误阻止,需要进一步的、未解释的帐户恢复。 最终,在投入大量时间后,Gemini 3 Pro 开始运行。然而,作者认为这个复杂的过程凸显了 Google 更关注大型组织而非个人开发者,并质疑 Gemini 3 Pro 的好处是否值得与更适合开发者的替代方案相比。

## 从数据中心到桌面:自制人工智能强劲动力 这个故事讲述了一位爱好者令人难以置信的旅程,他获得了企业级人工智能硬件并将其用于家庭用途。作者以7500欧元的价格买到了一套二手的Grace-Hopper超级芯片系统——通常价格超过10万美元,包含双Nvidia H100 GPU和Grace CPU。尽管它从液冷改造为风冷,且状况令人担忧,但作者还是冒险尝试了。 该项目涉及大量的拆卸、清洁和修改。定制的风冷解决方案通过3D打印和CNC加工制造,并搭建了一个新的桌面框架。然而,道路并非一帆风顺;系统最初出现关键风扇错误,更令人担忧的是,报告的GPU温度超过1600万度——这是由于传感器读数错误导致的,需要进行显微焊接修理。 克服了无数障碍后,该系统现在可以本地运行大型语言模型,例如一个235B参数的模型。总成本约为8930欧元。虽然需要大量的技术技能和耐心,但作者成功地将数据中心设备改造成了一个强大但非常规的家庭人工智能工作站,证明了即使没有巨额预算,也可以访问最先进的人工智能能力。

## DIY AI 强大机:Hacker News 摘要 一位 Reddit 用户以 7500 欧元的价格购买了一台二手 Nvidia GH200 服务器(专为液冷数据中心设计),并成功将其改装成一台能够本地运行 2350 亿参数大型 AI 模型的台式机。该项目并非一帆风顺,包括克服驱动问题(需要禁用 NVLINK)以及处理虚假的 1600 万度高温读数! 该用户详细描述了改造企业硬件的复杂过程,包括风冷改造和定制框架。虽然承认 RTX 6000 Pro 等较新的 GPU 提供了可比的性能,但 GH200 的高带宽内存和 NVLink 功能为大型模型提供了优势。 这个故事引发了关于二手企业硬件价值、使用数据中心 GPU 进行游戏所面临的挑战,以及通过提供私有、本地 AI 推理服务来回收成本的讨论。该项目突显了强大的 AI 计算对爱好者的日益普及,以及通过资源丰富的硬件获取实现显著节省的潜力。

电子前沿基金会(EFF)已启动一个新的资源中心,以对抗全球范围内不断涌现的、存在问题的年龄验证法,包括美国半数州以及最近的澳大利亚。虽然这些法律被宣传为儿童安全措施,但它们受到批评,被视为审查和监控的工具,可能阻碍所有年龄段的人获取重要信息,并通过身份证件检查和生物识别扫描等侵入性数据收集方式损害在线隐私。 EFF认为这些法律无效且有害,而是提倡全面的数据隐私立法。为了提高认识并赋能反对力量,EFF将于12月15日至17日在Reddit的r/privacy版块举办“随你问”(AMA)活动,并于1月15日举办一场专家小组讨论直播,讨论年龄验证的危险以及潜在的解决方案。 该资源中心([https://www.eff.org/age](https://www.eff.org/age))作为对抗这些限制性规定和促进真正的在线安全的信息和工具的中心。

电子前沿基金会(EFF)已启动一个资源中心,以应对日益普遍且存在问题的在线年龄验证法。这些法律旨在“保护儿童”,但引发了对监控和审查的担忧。 讨论的重点是替代侵入式身份验证的方案。一种建议涉及客户端HTTP标头,表明用户是“儿童”,允许网站相应地过滤内容,并将责任转移给家长以启用设备级别的家长控制。人们担心不同司法管辖区对年龄的定义不同,以及此标头可能被用于指纹识别。 许多评论员对这些法律背后的动机表示怀疑,认为它们是通往数字身份和政府及科技公司增加数据收集的垫脚石。普遍的观点是,优先考虑保护隐私的技术,例如零知识证明至关重要,而目前的努力集中在加剧现有监控问题的解决方案上。一些人认为,在这方面在线隐私的斗争已经失败,主张EFF专注于定义可接受的技术实施方案,而不是完全反对。

更多

联系我们 contact @ memedata.com