每日HackerNews RSS

你可能听说过RAS这个通用缩写,通常代表弹性、可用性和可维护性。但在IBM的时间同步领域,我们将RAS定义为弹性、准确性和安全性。时序、时钟、时间同步,特别是准确的同步,是现代IT系统的关键需求。这在涉及事务处理的行业(如金融行业)中尤其如此。对准确性的这种需求是IBM Z sysplex依赖于高度精确的时序和同步技术以确保数据完整性并能够从日志中重建数据库的原因。为此,IBM Z使用业内最好的恒温晶体振荡器(OCXO)。但到2025年,这还不够。我们还需要强大的弹性和安全性来维持这些级别的准确性。

IBM Z17 时间同步弹性增强 (planetmainframe.com) 11 分,由 rbanffy 发表于 9 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 PaulHoule 9 小时前 [–] 分布式系统有一个原则,即在非常大的系统中,你不能依赖时钟同步。但并行 Sysplex 的特点是它可扩展性不高,最多 32 个节点,但这些节点都非常大——整个系统足以满足财富 500 强大部分的需求,但与谷歌、脸书或少数几个真正大型系统相比,它仍然很小。Sysplex 围绕着分布式数据结构展开,类似于 Hazelcast 最初提供的那种。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Grov:面向工程团队的AI记忆 Grov通过捕获和重用AI推理,提升工程工作流程,节省时间和token成本,并结合Claude Code使用。通常,Claude在每个新会话中都会重新探索代码库,浪费资源。Grov拦截Claude的交互,提取关键架构决策和模式,并将这些“记忆”注入到后续会话中——使Claude能够跳过冗余探索。 安装简单:`npm install -g grov`,然后使用`init`进行配置,`proxy`运行。Grov通过监控Claude的操作,确保与初始目标一致并纠正偏差。 除了本地使用,Grov还提供通过云仪表板进行团队同步的功能(通过`grov login`和`sync`访问)。这允许团队共享学习到的见解,搜索过去的会话,并了解是谁发现了什么。 Grov还具有实验性的扩展缓存,以最大程度地减少Anthropic的提示缓存过期,并且需要Anthropic API密钥才能实现完整功能,包括偏差检测。它是一个开源项目,并且正在积极开发中,鼓励贡献。

## Grov:为Claude代码会话提供的持久记忆 一位开发者因为Claude代码反复重新分析代码库而感到沮丧,因此创建了**Grov**,一个本地代理工具,用于提高效率。Grov拦截Claude代码的API调用,使用LLM从会话中提取推理,将其存储在本地SQLite数据库中,并自动将相关上下文注入到未来的会话中。 测试表明,速度有了显著提升——原本需要10-11分钟的任务现在可以在1-2分钟内完成,无需Claude重新探索文件。与Claude的“恢复”功能(仅维护单个会话)不同,Grov聚合了所有过去会话的知识,甚至包括团队成员的会话,并根据文件路径和时间戳过滤相关性。 开发者强调Grov在团队协作方面的价值,允许开发者受益于彼此过去的推理。目前该项目仍处于早期阶段(v0.2.2),可在GitHub上获取,开发者正在寻求反馈。 类似利用时间图的项目也在出现。

## 最大神经语言数据集:数据收集摘要 在过去六个月里,作者们收集了一个约10,000小时的神经语言数据集,来自数千名个体——目前为止,这是同类数据集中最大的一个,旨在训练“意念转文本”模型,直接从大脑活动中解码语义内容。这些模型成功地预测了人们在说话或打字*之前*的想法,并在新受试者身上表现出零样本性能。 数据收集涉及参与者与LLM进行两小时的自由形式对话(使用Deepgram、OSS120B和ElevenLabs等工具),通过打字或语音进行。最初的结构化任务被开放式对话所取代,以最大化数据量和参与度。一个关键的重点是扩大规模:开发了具有动态定价/超额预订功能的定制预订软件,以最大化参与者流量,并通过实时监控和使用Zarr 3数据格式的自动化检查来提高数据质量。 大量精力投入到耳机设计中,结合多种模态(EEG等),以实现最佳信号捕获,并通过电极质量和基础设施调整来最大限度地减少噪声。团队发现,在一定规模(约4-5千小时)之后,数据量最终超过了降噪的重要性。通过这些优化,每可用小时的边际成本降低了40%。该项目现在专注于模型训练,并正在寻求合作和人才。

## Conduit.it:构建神经语言数据集 Conduit.it 已经收集了超过1万小时的神经语言数据,这些数据由内部团队构建和改进,旨在将思想解码为文本和语音。该项目最初是一个“三人的车库创业公司”,但规模已经扩大,目前拥有一支由7人组成的团队(3名工程师,4名数据收集员)。 最初缺乏“关于我们”页面,团队响应了反馈并计划添加一个。一个关键的重点是数据质量——改进实时检查将可用数据从58-64%提高到90-95%。他们发现来自*更多*人的数据能产生更好的泛化能力,目标是总共收集50-70k小时的数据。 该模型显示出令人鼓舞的结果,甚至可以在没有精确的词语匹配的情况下预测想法。虽然目前更擅长解码打字文本,但它可以在打字和语音之间进行泛化。未来的计划包括将数据收集扩展到其他地点,并开发一种由思维控制的计算机界面,重点是新的交互范式。该团队正在积极寻求社区反馈。

## 遗留更新:保护微软的过去 遗留更新是一个档案,致力于保存2012年至2025年间从微软下载中心移除的下载内容。微软已停止对众多较旧产品(包括Windows 95/98/XP/Vista/7、Office套件以及Visual Studio和SQL Server等开发工具)的支持,并随后删除了相关文件。 该项目记录了这些丢失的下载,提供对诸如.NET Framework运行时、Visual C++可再发行组件、旧版Office查看器,甚至Virtual PC等免费软件的访问。在提供这些遗留程序访问的同时,遗留更新*强烈*警告用户这些下载不受支持,可能包含安全漏洞,建议用户在安装后通过该网站检查更新。 该档案严重依赖Archive Team和互联网档案的Wayback Machine的工作,承认他们在保护在线历史方面发挥的关键作用。它提供了一个可搜索的数据库,并突出显示常用下载文件,旨在为那些需要访问旧软件以实现兼容性或历史目的的人们提供资源。

## 遗留微软下载档案受到关注 一篇 Hacker News 讨论强调了 [legacyupdate.net](https://legacyupdate.net/) 的价值,这是一个旧版微软软件(如 PowerToys 和 Windows 安装文件)的档案。用户回忆起使用 PowerToys 定制 Windows XP 和 95,从而获得接近 Unix 的体验。 该档案填补了一个关键需求,为维护遗留系统的人员提供支持——包括工业机械、研究实验室和安全研究人员——这些系统依赖于较旧的操作系统和软件,而这些操作系统和软件不再受微软官方支持。用户还提到需要运行特定软件版本(例如 Acid Pro 6)或保留复古计算设置。 该网站受到高度评价,并通过 GitHub 和 Patreon 获得捐赠支持。有人建议增加 Liberapay 和 OpenCollective 等捐赠选项,以拓宽资金渠道。人们对这类档案的长期安全性表示担忧,但目前的维护者拥有良好的记录。最终,该档案为无法从旧版 Windows 升级的用户提供了宝贵的资源。

## NVIDIA 的 AI 主导地位:表面下的裂痕? NVIDIA 最近的 2026 财年第三季度财报显示,营收增长 62% 至 570 亿美元,主要得益于其数据中心部门(现在占业务的 90%)。然而,更深入的分析显示,尽管数字令人印象深刻,但仍存在潜在问题。担忧包括报告的净收入(319 亿美元)与经营现金流(238 亿美元)之间的差距,库存翻倍(约 198 亿美元),以及应收账款周转天数增加(53 天),表明依赖于延长的信用条款。 更复杂的是,围绕 NVIDIA、OpenAI 和 Oracle 之间潜在的“循环融资”安排的审查正在加剧。NVIDIA 承诺对 OpenAI 的投资推动了与 Oracle 的巨额云协议,而 Oracle 又订购了数十亿美元的 NVIDIA GPU——如果 NVIDIA 的投资被移除,这引发了对其可持续性的质疑。 与此同时,OpenAI 正在积极减少对 NVIDIA 的依赖,直接采购 DRAM 晶圆等关键组件(绕过 NVIDIA 的供应链),并挖走 NVIDIA 的关键芯片人才。Oracle 也在探索其他选择,可能包括收购 Groq——一家为 AI *推理* 提供更快、更便宜替代方案的初创公司——以绕过 HBM 短缺并提高利润率。 这种情况表明,权力动态正在发生变化,NVIDIA 的最大客户正在准备替代方案,这可能会对其长期主导地位构成挑战。虽然 AI 硬件市场竞争依然激烈,但未来的几个季度将揭示 NVIDIA 是否能够在这些新兴挑战中保持其地位。

## NATS JetStream 耐久性测试总结 Jepsen 测试揭示了 NATS JetStream 存在一些耐久性问题,尽管它声称提供“至少一次”投递和线性一致性。虽然在 2.12.1 版本(修复了 2.10.22 的问题后)中,简单的崩溃不会导致数据丢失,但文件损坏和模拟的操作系统级故障会导致数据丢失。 具体来说,JetStream 的数据 (.blk) 或快照文件中的单比特错误或截断会导致写入丢失——有时是大的块——甚至流删除,节点之间会出现不一致(分裂脑)。重要的是,即使损坏仅限于少数节点,这些问题也会发生。 此外,JetStream 的默认配置承认在将数据刷新到磁盘*之前*确认发布(每两分钟一次),这使得最近的写入在断电或快速节点故障期间容易丢失。单个操作系统崩溃,与其他故障结合,也可能导致数据丢失和分裂脑。 这些测试凸显了 JetStream 声明的自我修复和始终可用目标与 CAP 定理之间的冲突,后者规定一致性、可用性和分区容错性之间的权衡。Jepsen 建议要么默认强制同步磁盘写入,要么清楚地记录相关故障下潜在的数据丢失可能性。

## Jepsen 报告关于 NATS 2.12.1 - 摘要 最近的 Jepsen 报告揭示了 NATS JetStream 存在严重的数据持久性问题,JetStream 是构建在 NATS 之上的持久化消息系统。核心问题是:NATS 默认每两分钟才将数据刷新到磁盘一次,并立即确认写入——这是优先考虑速度而非数据安全的权衡。这可能导致在并发故障期间丢失已提交的写入数据。 Hacker News 的讨论强调了一个反复出现的主题:理论正确性和实际实现之间的紧张关系。许多评论员指出,许多项目跳过了基础理论,并为此付出代价。一些人认为,人工智能可能能够根据项目声明预测这些问题。 争论扩展到更广泛的分布式系统领域,与 Kafka、Redis 和其他技术进行比较。虽然 NATS 在临时消息传递方面表现出色,但其 JetStream 的持久性声明现在受到审查。讨论还涉及理解系统默认设置以及性能和数据一致性之间的权衡的重要性。最终,该报告被认为是宝贵的,可能会推动 NATS JetStream 持久化层的改进。

“创作者经济”并非新事物——它*就是*现代媒体和互联网经济,驱动着抖音和YouTube等大型平台。然而,它的基础存在严重缺陷。这些平台通过优先算法来分隔创作者与直接受众的联系,并仅为创作者提供微薄的收入回报,从而迫使他们不断追逐病毒式关注和品牌合作。 最终,创作者的可持续收入在于销售*产品*,而不仅仅是观看量。杰克和洛根·保罗的矿泉水品牌以及MrBeast令人惊讶的亏损YouTube频道(通过在沃尔玛销售巧克力来弥补)都证明了这种转变。 这个系统是一个高效且充满争议的购物网络,它主宰着文化并逃避责任。这是一个剥削的循环,不断地被新的创作者补充,它不是未来的趋势——而是媒体运作的现状。

## 创作者经济与互联网的演变 一篇《Verge》文章引发的讨论探讨了“创作者经济”如何从根本上改变了互联网,许多人认为这是一个负面转变。核心论点并非仅仅关于创作者本身,而是关于垄断公司的主导地位,它们将网络转变为一个由愤怒驱动、缺乏问责制的“超级购物系统”。 评论员指出,这并非新鲜事——媒体*一直*容易被操纵——但互联网的规模放大了现有的问题。社交媒体的兴起和整合取代了以前多样化的本地媒体景观(报纸、广播、BBS论坛),取而代之的是一个优先考虑算法参与而非真正社区联系的系统。 人们对市场网站对假冒商品的责任以及对更新的监管和反垄断措施的需求表示担忧。 还有人强调了货币化本身会剥夺在线活动乐趣的固有问题。 这篇文章不同寻常、故意花哨的网络设计也是讨论的焦点,一些人认为这是对早期互联网美学的怀旧致敬。

## 微型 GLSL 演示:学习之旅 过去两个月,作者创作了一系列小型 GLSL 演示(月光、入口 3、群岛和可爱),字数限制在 512 个字符以内。本文重点介绍创作过程中获得的*学习经验*,而非详细的代码分解(已在之前的“红阿尔卑斯”文章中介绍)。 一个关键发现是简化的体积光照技术:在光线行进中,使用 `1/d`(其中 'd' 是密度)可以提供物理启发的光照衰减近似值,避免复杂的计算。进一步的探索涉及使用包含吸收和透射值的公式来实现透明度。 “入口 3” 强调了使用 L-∞ 范数简化距离函数,以及通过 Sympy 计算的矩阵变换实现的独特相机设置。“群岛” 使用域扭曲和 Acerola 的工作找到的特定噪声公式来创建多样的地形。最后,“可爱” 使用 smoothmin 运算符实现圆角形状,并使用 IK 进行动画,利用迭代次数作为自然的深度提示。 作者强调这些限制的价值——促进专注学习、艺术表达和项目完成。512 个字符的限制,部分是为了与 Mastodon 兼容,迫使创造性的问题解决和对代码工艺的奉献。更新和更多内容可以在 Mastodon 和 RSS 上找到。

这个Hacker News讨论围绕着ibobev (pkh.me)分享的一系列GLSL演示,展示了用最少代码创造视觉上令人惊艳图形的技术。用户对其中的艺术性和效率印象深刻,注意到简洁的着色器可以生成复杂的“宇宙”。 一个关键点是,即使是图形程序员也常常难以理解这些代码。这归因于着色器的数学基础,变量名通常直接反映方程,并且更注重指令数量而非可读性。有些人对此感到沮丧,而另一些人则欣赏这种挑战以及与底层数学的直接联系。 对话还涉及学习资源,Shadertoy.com被强调为一个有价值的灵感和教育平台。许多评论者表达了学习GLSL的愿望,将其描述为“用数学写成的诗”。原始作者鼓励实验,并将这些演示视为艺术灵感而非严格的教程。最后,一位用户指出当前聊天机器人难以从图像中重现这些着色器。

## SQLFlow:基于Kafka的流处理 本指南详细介绍了SQLFlow的设置方法,SQLFlow是一种流处理器,能够对Kafka流运行SQL查询。首先,安装依赖项(`pip install -r requirements.txt`)并拉取Docker镜像(`docker pull turbolytics/sql-flow:latest`)。 在处理实时数据之前,可以使用提供的fixtures通过`docker run`命令和`invoke`命令来测试配置,确保SQL逻辑正确。 要将SQLFlow作为流处理器运行,请启动Kafka实例(使用`docker-compose -f dev/kafka-single.yml up -d`)并将测试数据发布到Kafka主题(`python3 cmd/publish-test-data.py`)。然后,使用`docker run`启动SQLFlow,将其指向您的配置文件和Kafka brokers。 最后,通过使用Kafka控制台消费者(`docker exec -it kafka1 kafka-console-consumer...`)来消费输出主题,查看处理后的输出。目标是在5分钟内拥有一个可运行的流处理器,能够读取和处理Kafka数据。

## SQLFlow:基于DuckDB的轻量级流处理 SQLFlow是一个新的流处理引擎,围绕DuckDB构建,旨在简化传统上需要复杂JVM系统才能完成的任务。它的目标是使用最少的资源(约250MiB内存)处理每秒数万条消息,并利用DuckDB丰富的连接器生态系统。 其核心思想是使用SQL定义处理来自Kafka的“批次”数据的管道。虽然看起来是批处理,但SQLFlow通过持续流动数据并允许可配置的批次大小(甚至可以小到每次一条消息)来实现流处理,从而确保至少一次传递。 开发者对其潜力感到兴奋,尤其是在Flink等完整解决方案过于庞大的用例中。与Tributary等项目相比,SQLFlow专注于为生产环境提供完整的服务,包括DevOps工具(指标、测试、管道即代码)。目前的限制包括缺乏流到流的连接支持,这是开发者正在考虑优先处理的一个功能。 更多信息请访问:[https://sql-flow.com/](https://sql-flow.com/) 和该项目的GitHub仓库:[https://github.com/turbolytics/sql-flow](https://github.com/turbolytics/sql-flow)。

量子书讯宣布即将出版两本由顶尖科学家撰写的书籍:《数学六要素》由数学家陶哲轩撰写,以及《万物皆场》由理论物理学家戴维·汤撰写。 陶哲轩的书籍是他首次面向大众读者,旨在通过探索六个核心概念——数字、代数、几何、概率、分析和动力学来揭开数学的神秘面纱,这些概念是该领域的基石。他认为数学是一种对每个人都至关重要且易于理解的思维方式。 戴维·汤的《万物皆场》解释了量子场论,揭示了宇宙的基本构成要素并非粒子,而是渗透于整个存在的“场”。他以清晰和热情的态度呈现了这个复杂的主题。 量子书讯是一家专注于阐释现代科学的出版社,还将于2026年6月出版凯文·哈特内特的《代码中的证明》,详细介绍Lean证明助手的发展及其通过人机协作彻底改变数学的潜力。

## 量子书社将出版陶哲轩和童伟光作品 Hacker News 讨论了西蒙斯基金会的新出版项目量子书社,该项目将出版特伦斯·陶和戴维·童的流行数学和物理书籍。这一消息引发了人们对过去备受喜爱的科普作家们的讨论。 用户们怀念阿西莫夫和伽莫夫易于理解的非虚构作品,并感叹这些作者如何淡出公众视野。围绕阿西莫夫的科幻小说与非虚构作品,出现了一场辩论,一些人赞扬了他的科普写作,而另一些人指出即使在他的非虚构作品中也存在随意歧视女性的现象。马丁·加德纳和卡尔·萨根也被提及为具有影响力的科学传播者,他们一直保持着持久的受欢迎程度。 许多评论者推荐了特定书目,包括伽莫夫的《一、二、三……无穷大》和阿西莫夫的短篇小说《黑夜》和《最后的疑问》。讨论还涉及支持像 Quanta 这样独立、专注于科学的出版物的重要性,以及像吉姆·西蒙斯这样资助这些事业的慈善家的积极影响。新书的发行日期定于 2026 年 6 月至 2027 年初。

更多

联系我们 contact @ memedata.com