MemeData

每日HackerNews RSS

“稍后再说”是一个功能。 "Maybe later" was a feature 28 天前

任何代码仓库中最有价值的代码，往往是你选择不去写的那些。许多开发者维护着堆积如山的“新颖”功能、迁移计划或架构重构，但这些工作却从未被优先处理。回首往事，通常会发现避免这些项目反而带来了净收益；否则，它们只会沦为难以维护的遗留代码，或随着产品的转型而变得无关紧要。 AI 编程的兴起带来了一种危险的诱惑：由于生成代码的成本极低，团队开始“疯狂堆砌”，将积压清单中的所有内容都开发出来，而不是精心筛选出真正必要的部分。这种趋势有导致代码库臃肿的风险，充斥着不必要的功能、冗余的实现以及难以管理的混乱结构。战略性开发需要洞察力。我们必须抵制仅仅因为“可以做”就去构建的冲动。“不构建”是一项强大的架构特性，它能提升生产力并保持产品专注。随着 AI 能力的增强，担任“策展人”的角色——决定不做什么，并主动消除技术债务——将依然是人类的核心优势。归根结底，维护一个简洁、高效系统的最佳方式是认识到：有时最有效的工程决策就是什么都不做。

深入 FAISS：十亿级相似度搜索 Inside FAISS: Billion-Scale Similarity Search 28 天前

为了压缩高维向量（例如 128 维的 SIFT 描述符），乘积量化（Product Quantization, PQ）提供了一种强大的替代方案，避免了存储未压缩数据时可能耗费的数百 GB 内存。类似于 GIF 的调色板——将 24 位像素映射到 256 色索引，PQ 通过使用来自“码本（codebook）”的代表性质心索引来替换向量。虽然使用单一的扁平码本来实现高压缩率（例如 64 位编码）需要天文数字般的质心数量，这会超出存储限制和训练数据的可用性，但 PQ 通过一种分解技巧解决了这个问题。通过将高维向量拆分为 $m$ 个较小的子向量，并为每个子向量分配一个小型的专属码本，PQ 在仅占用极小、可缓存内存的情况下，实现了巨大的有效搜索空间（例如 $256^8$ 种组合）。这使得压缩比达到 64 倍，将包含十亿级 SIFT 描述符的海量数据集压缩至可管理的范围内，同时还能保持有效的距离估算能力。

这篇 Hacker News 帖子讨论了一份名为“深入 FAISS：十亿级相似度搜索”的新交互式指南，该指南旨在作为 2017 年 FAISS（Facebook AI 相似度搜索）研究论文的可视化配套资料。作者解释说，该指南专注于简化诸如 IVFPQ/IVFADC 等复杂概念，这些概念通常很难仅从学术文本中理解。该项目因其高质量的可视化效果而受到了社区的高度赞扬。在讨论中，评论者谈到了 FAISS 的现状。尽管该库仍然是向量搜索的基础工具，但一些用户指出其维护力度有所下降。作者认为，这可能是由于 Meta 在组织架构调整后内部优先级的改变，以及行业向托管向量数据库服务（如 Pinecone、MongoDB Atlas 和 pgvector）的转向所致。虽然作者计划在未来的文章中介绍 NSG 和 FastScan 等更高级的 FAISS 主题，但当前的资源为那些希望了解大规模相似度搜索底层机制的人提供了一个绝佳的切入点。

做最难的事 Do the Hardest Thing 28 天前

打造高价值企业的秘诀在于选择“最困难的事”，而非仅仅是“最辛苦的工作”。许多创业者误以为高投入、低价值的劳动（例如经营一家繁忙的零售店）就是战略性挑战。然而，真正的“难事”涉及解决那些因难度大而被他人规避的复杂且具有高影响力的问题。由于很少有人愿意忍受攻克这些艰巨障碍所需的长期磨砺，竞争对手更少，潜在的回报也显著更高。这种理念与杰西·汉利（Jesse Hanley）及本文作者的观点不谋而合：你最好的创业点子往往是那些让你感到最畏惧的。通过在你专业领域内解决最具挑战性的问题——即存在需求但他人望而却步的领域——你就能让自己的努力与幂次法则保持一致。成功很少源于分散精力去处理许多琐碎、简单的项目；相反，它源于识别出一个真正困难且有价值的问题，长期投入其中，并保持专注，直到这种难度本身成为你的竞争优势。归根结底，既然任何生意都需要投入巨大的精力，那么将这些精力花在能带来超额回报的“困难”问题上，才是更明智的选择。

抱歉。

我的测试驱动开发代理技能 My Agent Skill for Test-Driven Development 28 天前

目前 AI 智能体在编写有效测试方面表现欠佳，这主要是因为它们模仿了人类代码中普遍存在的糟糕测试习惯。然而，作者认为，如果能引导智能体遵循永恒的软件工程原则，而非任其自行发挥，它们完全可以编写出高质量且有意义的测试。解决方案在于为智能体提供基于成熟方法论的结构化“技能”。具体而言，作者主张采用 **Kent Beck 的 TDD 准则**及其自创的 **“指定-编码-实现”（SEF）循环**。为了进一步提升质量，作者还引入了“测试设计评审”技能——由另一个智能体对代码进行审查，确保其侧重于结果而非实现细节，并配合“软件设计评审”来维护整体架构的规范性。作者的经验表明，当 AI 受到这些经典原则的约束时，它会成为更可靠的工具。核心结论是：AI 开发中最大的生产力提升，并非来自原始算力的堆砌，而是通过强制模型遵循那些经过实战检验的、不可动摇的软件设计方法论来实现。

这段 Hacker News 帖子讨论了使用测试驱动开发（TDD）和“智能体技能”（系统级 Markdown 提示词）来引导 AI 编程智能体的有效性。 **关键要点：** * **关于 TDD 的争论：** 观点各异。支持者认为 TDD 提供了必要的护栏，有助于重构并确保业务逻辑的准确性。批评者则认为它显著增加了 Token 成本和延迟，并指出当前的现代大模型能力已足够强，无需进行繁琐的测试。 * **智能体技能：** 用户讨论了“技能”（即加载到 AI 上下文中的系统指令）是否有效。一些人认为它们对于强制执行团队标准、设计系统或特定工作流（如 Python 的 `uv`）至关重要；另一些人则将其斥为“伪科学”，认为它们不可靠且经常被模型忽略。 * **最佳实践：** 许多贡献者倡导采用混合方法：使用明确的指令来规定质量标准（如使用 `pytest` 或避免过度 Mock），但同时保持工作流的灵活性。大家的共识是，当测试作为验证 AI 输出的“判定标准”而非僵化的预设流程时，其价值最高。

Cloudflare CEO 在机器人流量激增的问题上对你撒了谎 Cloudflare CEO Is Lying to You About the Bot Traffic Jump 28 天前

文中指出，Cloudflare 首席执行官马修·普林斯（Matthew Prince）声称机器人流量已超过人类流量，这是一种歪曲公司自身数据的“魔术”骗局。作者认为，普林斯通过选择性地引用“仅限 HTML”的流量统计数据来制造虚假叙事，却无视了他自己仪表盘上显示的“全部”流量数据——后者证实约三分之二的互联网流量仍来自人类。此外，该评论反驳了普林斯将“代理型”人工智能机器人视为流量增长主要动力的说法。作者指出，“代理型”流量在统计学上微不足道，而人工智能相关流量的实际增长，是由用于训练大语言模型的大规模抓取机器人所驱动的。最终，文章认为这一叙事是一种经过精心计算的销售策略，旨在将其“付费抓取”服务商业化。通过将大规模抓取工具与代理型工具混为一谈并歪曲整体数据，这位首席执行官被指控编造了一种危言耸听的趋势，以谋取商业利益。

近期 Hacker News 上的一场讨论对 Cloudflare 首席执行官的言论提出了质疑，该言论称互联网历史上机器人流量首次超过了人类流量。批评者认为这一说法具有误导性，指出其仅通过专注于 HTML 请求来筛选数据。当分析“所有流量”（包括图像、CSS 和其他资源）时，人类流量依然显著高于机器人流量。评论者指出，虽然机器人流量确实非常庞大，但对“代理流量”（agentic traffic）的定义很复杂，且该首席执行官的言论可能更多是出于营销炒作，而非对网络数据的全面审视。除了这一具体主张外，这场辩论还凸显了人们对 Cloudflare 作为互联网无处不在的“中间人”角色的深层担忧。许多参与者表达了对该公司在流量方面拥有巨大中心化控制权的不安，并警告称这种垄断在数据监控、政府访问以及产生不可靠的“黑箱”统计数据方面构成了重大风险。尽管一些支持者认为 Cloudflare 只是满足了市场对 DDoS 防护和效率的需求，但批评者的共识是，该公司对现代网络生态系统的影响力是危险的，需要接受更严格的审查。

印度出人意料的生育率骤降 India's surprise baby bust 28 天前

请启用 JavaScript 和 Cookie 以继续。

《经济学人》近期关于印度生育率意外下降的报道，在 Hacker News 上引发了关于全球人口变化原因及后果的热烈讨论。评论者普遍认为，工业化和女性受教育程度的提高——正如其他国家历史所见——是这一趋势的关键驱动因素。然而，用户们也探讨了为何各种干预措施均无法扭转这一趋势。提出的解释涵盖了现代“无孩”生活方式带来的享乐诱惑、育儿的高昂机会成本，以及化学污染等环境因素。辩论的很大一部分集中在社会经济影响上。许多用户将“婴儿潮消失”视为一种自然的、可能是有益的转型，有助于实现可持续的平衡。相反，持怀疑态度的人则警告会陷入“失控的螺旋式下降”，认为依赖持续经济增长和税基的现代社会保障体系，在面对劳动力萎缩时根本无力应对。尽管一些人认为社会变革——例如全民托儿服务或重构经济以支持非增长模式——是必要的，但另一些人则认为人口下降是个人的选择，反映了全球优先级发生转变，即传统的大家庭激励机制已不再适用。

Claude 增加了 rsync 的 bug 吗？ Did Claude increase bugs in rsync? 28 天前

这项分析旨在调查关于“由 Claude 辅助生成的代码提交导致 rsync 工具稳定性下降”的说法。报告通过分析 46 个版本，对比了受 Claude 影响的版本与该项目历史缺陷率的分布情况。数据表明，没有任何统计学证据支持这种负面影响。两个 Claude 辅助生成的版本均处于历史缺陷率的“中间 50%”区间内。统计学检验——包括精确置换检验（p=46%）和费希尔精确检验（p=74%）——证实这些版本与历史随机样本并无区别。值得注意的是，该项目历史上缺陷最多的版本出现在 AI 引入之前，但当时并未引发类似的公众强烈抗议。作者认为，这种“愤怒”是认知偏见而非实证现实的产物。人们所感知到的回归问题增加，源于必要的安全补丁数量增多（部分原因是 AI 生成的漏洞报告激增），而非 AI 辅助代码本身的质量问题。最终，分析指出批评者是在通过事后关联构建叙事，以证明其预设的反 AI 立场，却忽视了 rsync 的缺陷率依然处于历史正常范围这一现实。

最近 Hacker News 上有一篇试图通过统计数据来反驳“Claude 辅助生成的代码增加了 rsync 漏洞”这一说法的文章，遭到了激烈的抵制。批评者大多忽略了其中的技术分析，转而抨击文章的文风，因为这些内容很大程度上是由大语言模型（LLM）生成的。社区的反应突显了一个反复出现的主题：用户往往将“AI 味”的写作视为低质量、不可信或“垃圾”内容的标志，这无论证据本身如何，都会产生信任壁垒。许多评论者认为，不管数据是否准确，使用 AI 来阐述技术发现会掩盖作者本人的观点和主导性。作为回应，作者（他坚持认为实际分析是基于可复现的脚本和统计方法）最终用自己的口吻重写了文章，以应对社区的敌意。这次事件是一个典型的案例，说明了写作中的“AI 特征”如何疏远技术受众，并引发激烈的“琐事争议”（即关注琐碎的美学问题而非实质内容），最终掩盖了本应进行的技术讨论。

Sakana AI 递归自我改进（RSI）实验室 Sakana AI's Recursive Self-Improvement (RSI) Lab 28 天前

Sakana AI 在东京成立了“递归自我改进（RSI）实验室”，旨在将人工智能范式从暴力规模化转向高效且优雅的自主化。受日本制造业“以少胜多”的卓越传统启发，该实验室致力于构建能够自我重塑和改进的 AI 系统。基于过去两年的研究积累，包括发表于《自然》杂志的《AI 科学家》（The AI Scientist）以及“LLM-Squared”等突破性成果，该实验室专注于演化优化循环。这些系统超越了静态的人工驱动开发模式，转向在主权且可持续的算力预算内运行的自主、自升级智能体。通过利用演化动力学，Sakana AI 旨在证明前沿智能的发展无需依赖目前由超大规模算力巨头垄断的集群。 RSI 实验室目前正在东京扩充团队，诚招研究人员和工程师共同构建下一代“原生智能体”（Agent-Native）架构。通过将递归自我改进视为一项基础工程挑战，并辅以可验证的安全保障，Sakana AI 致力于将前沿 AI 民主化，使其从“赢家通吃”的资产转变为能够促进全球科学与社会进步、且易于获取的可扩展技术。

抱歉。

伪钞铸就了美国 Fake Money Built America 28 天前

在《伪钞之国》一书中，斯蒂芬·米姆（Stephen Mihm）探讨了19世纪美国混乱的金融体系，当时合法银行业与伪钞制造之间的界限极其模糊。在那一时期，数以千计的独立银行发行各自的纸币，使公民几乎无法分辨真伪。在像中西部这样资源匮乏的地区，伪钞往往被视为促进贸易的必要公共服务而广为接受。由于联邦政府缺乏统一货币且放弃了监管，许多人将这种“信誉良好”的伪钞视为流动性的重要来源。米姆认为，银行家与伪钞制造者之间的区别往往仅在于法律地位而非经济职能；两者本质上都是满足国家对信贷贪婪需求的投机者。这段金融无政府状态直到南北战争才告终，因为战争需要一种稳定的国家货币。随后美国特勤局的成立，将伪造货币从一种常见的麻烦转变为对国家主权的直接威胁。最终，米姆指出，这些早期的伪钞制造者是美国发展的意外催化剂，他们提供的资本与信贷助力了国家经济的快速扩张。

抱歉。

Gov.uk 弃用 Stripe，改用荷兰支付服务。 Gov.uk has replaced Stripe with Dutch provider Adyen 28 天前

英国政府数字服务局（GDS）已将其 GOV.UK Pay 平台针对地方政府、警方和武装部队的支付处理服务提供商，由 Stripe 更换为荷兰的 Adyen 公司。这份为期三年的合同价值最高达 2530 万英镑，涵盖了该平台约 17% 的交易量，但服务对象却超过了平台参与机构总数的 70%。此次迁移涉及将约 1,000 项服务转至 Adyen 处理。据 GDS 表示，此次转换对用户而言将是无缝衔接的，且功能不会有任何损失。此次更换的一大优势是引入了“银行直接支付”（pay by bank）功能。通过利用开放银行技术，该功能允许用户在账户间直接转账，无需手动输入银行卡详细信息。 GOV.UK Pay 依然是一个旨在简化公共服务在线收款流程的集中式工具。虽然中央政府和国家医疗服务体系（NHS）机构将继续使用 WorldPay，但 GDS 仍致力于简化公共部门的交易流程；自 2016 年以来，该平台已处理了超过 92 亿英镑的资金，交易笔数达 1.375 亿次。

英国政府已将其集中的“GOV.UK Pay”服务供应商从 Stripe 更换为荷兰支付服务商 Adyen。此次调整在 Hacker News 上引发了关于全球支付系统经济与基础设施的广泛讨论。批评者认为，当前的银行卡处理费（通常由商家隐藏或承担）实际上是一种“反竞争税”，它以牺牲普通消费者为代价，使金融机构和信用卡奖励计划获益。许多参与讨论者指出，与欧洲相比，美国的支付生态系统极其昂贵；另一些人则强调，巴西 Pix 等由政府支持的高效即时支付渠道正在崛起，可作为减少对传统卡组织依赖的范本。此次讨论还涉及了两家公司的市场定位：Stripe 因其对开发者友好且易于自助接入而备受赞誉，而 Adyen 则被视为面向大型企业客户的“守门人”，往往会拒绝小型企业。尽管有人认为此举标志着欧洲各国政府正寻求从美国科技公司手中夺回数字主权，但也有人认为合同规模较小，Adyen 的入选更多是基于高频政府服务需求的务实考量，而非重大的战略转型。