每日HackerNews RSS

## Floe 中的布隆过滤器:更快的查询与降低的误判率 Floe 利用布隆过滤器——一种概率数据结构,能够快速确定一个元素*绝对不在*一个集合中——来大幅加速 SQL 查询,特别是哈希连接。这些过滤器避免了不必要的数据解压缩和哈希表探测,从而提高效率。 Floe 在两个关键领域使用布隆过滤器:在存储引擎内部,在解压缩*之前*过滤列;以及在哈希连接期间,预先过滤探测侧的行。自适应过滤会根据统计信息动态地启用/禁用存储引擎过滤,从而最大限度地提高性能。 核心优化集中在降低误判率上。标准方法会导致过滤器填充时误判率升高。Floe 通过为每个 uint32 存储*两个*比特,并使用单个哈希函数确定比特位置,从而提高了准确性。这几乎将准确性提高了一倍(将误判率从 11.7% 降低到 5.7%),且性能成本最小——每行仅增加一纳秒——并避免读取可能达到数十千兆字节的不必要数据。 这种方法优先考虑固定大小(256KB),以实现可预测的性能、无锁访问和高效的缓存利用率,使其成为像 Floe 这样的并发数据库引擎的理想选择。未来计划进行进一步优化,例如使用 SIMD 指令。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 两比特比一比特好:使布隆过滤器准确度提高 2 倍 (floedb.ai) 11 分,由 matheusalmeida 发表于 2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 黑暗森林互联网:人工智能与安全未来 受刘慈欣《三体》启发,一种令人不安的现实正在浮现:在人工智能时代,可见性等同于脆弱性。传统的网络安全——专注于检测和响应——正变得过时,因为人工智能工具以前所未有的速度和规模自动化侦察、漏洞发现和利用。像PentAGI和Anthropic的Claude这样的工具展示了人工智能即使在多年人工审查后也能发现关键缺陷的能力。 互联网正在从“开放城市”转变为“黑暗森林”,任何信号——开放端口、IP地址或DNS记录——都会吸引自动“猎人”。这需要超越“零信任”走向“零可见性”:基础设施在证明加密身份之前保持完全隐藏。 这种架构转变涉及通过网络隐藏、加密协商和默认拒绝网络来消除暴露,例如OpenNHP项目所示。核心问题不再是*如何检测*攻击,而是*如何使攻击变得无关紧要*,通过完全消除攻击面。未来的安全在于消失的门,而不是更好的锁,因为人工智能会无情地扫描任何它可以找到的东西。

## 人工智能下的互联网“黑暗森林” 最近的Hacker News讨论集中在人工智能在网络安全领域发展带来的危险“黑暗森林”概念上。原始文章(opennhp.org)指出,人工智能正在改变格局,攻击者可能通过自动化获得优势。 评论员指出这不是什么新鲜事——攻击者*一直*领先一步——但人工智能放大了威胁。新的开源和商业人工智能工具,如PentAGI和Claude Code Security,正在出现用于渗透测试,引发了对军备竞赛升级的担忧。 一些人认为,重点不应该放在*更快*的防御上,而应该放在根本性地改变可见性。另一些人则指出现有的监控能力和潜在的权力滥用,并提及国土安全部(DHS)的支出和法律问题。一个历史轶事强调了休眠恶意软件的普遍性,表明当前系统已经受到损害。这场讨论最终质疑防御是否能跟上日益自动化的攻击。

浮世絵搜索提供了一项惊人的资源:仅需拍摄现有版画的照片即可搜索日本木版画,并且能够查看多个版画收藏中的相似作品。以下是一个示例版画,点击查看实际效果。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 日本木刻版画搜索 (ukiyo-e.org) 4 分,来自 curmudgeon22 11 分钟前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Palantir 的影响:摘要 这个开源书籍项目探讨了 Palantir 的核心技术——“本体”(Ontology),它不仅仅是 IT,更是组织决策和未来人工智能的基础运作层。它弥合了工程和商业理念之间的差距,详细介绍了 Palantir 的数据整合方法。 与传统的数据系统(“死数据沼泽”)不同,Palantir 的本体创建了现实的“数字孪生”,数据*直接*驱动业务运营。这通过三个核心原则实现:将静态“名词”(对象)与动态“动词”(行动)整合,将数据视为运营层,并实施强大的“现实治理”——对现实世界流程的版本控制。 本书详细介绍了这种架构如何实现快速迭代和控制,即使在自主人工智能建议的情况下,也能通过分支和审查流程实现。它展示了 Palantir 的用例,并设想了一个本体与人工智能融合以改变组织的未来,倡导一种面向数据设计的“本体思维”方法。

## Palantir 的优势:本体论与可访问性 最近 Hacker News 上的一场讨论集中在 Palantir 的成功上,认为这并非归功于人工智能,而是源于一种复杂的“本体论”——一种建模数据关系的方式。一个 GitHub 项目 ([github.com/Leading-AI-IO](https://github.com/Leading-AI-IO)) 触发了这次讨论。 一些评论员认为这只是一种标准数据库技术(视图、UDF),但另一些人强调 Palantir 的价值在于它使复杂的数据分析能够被非技术用户访问,尤其是在执法和政府机构中。该平台擅长整合结构化和非结构化数据,提供用户友好的界面来搜索和关联信息——本质上是一个针对性的、强大的数据搜索引擎。 许多用户指出 Palantir 并不一定提供革命性的技术,但它的优势在于它愿意承担敏感项目,提供现场工程支持,以及能够简化数据访问,让缺乏技术专长的人也能使用。 讨论还引发了对强大的数据科学工具被政府使用以及需要在自由与安全之间取得平衡的伦理影响的担忧,并呼吁进行公众讨论。

红罗宾股价戏剧性下跌96%是一个警示故事,告诫人们不要将短期削减成本置于客户体验之上。2018年,这家餐厅连锁店取消了服务员和支持人员以降低劳动力成本,导致服务速度显著减慢、等待时间增加以及大量顾客流失——最终使公司价值仅为6500万美元。 相比之下,在新的领导下,Chili’s投资于其客户体验,简化了菜单并推出了一款病毒式传播的10.99美元套餐。这一策略推动了同店销售额增长31%,市值达到33亿美元——与红罗宾相比,是后者的50倍。 核心信息是,在当今市场,尤其是在人工智能兴起的背景下,微小的效率提升是不够的。公司必须专注于雄心勃勃的增长和提供卓越的价值,而不仅仅是降低成本。Chili’s的成功表明,投资于质量和客户满意度可以带来可观的回报,而红罗宾的失败凸显了“短视”的危险,以及为了季度收益而牺牲长期愿景的风险。

这场 Hacker News 讨论围绕一篇名为“Red Robin Died by Spreadsheet”的文章,分析了这家餐厅连锁的失败。评论员们提出的一个关键点是,人工智能生成内容的日益普及及其对内容质量的影响。 一位用户指出人工智能的迹象,例如缺乏明确主语的句子结构和重复的措辞(“不仅仅是X,而是Y”)。他们担心人工智能生成的商业分析往往流于表面,并证实了现有的偏见,质疑文章的价值,尽管他们尊重作者一贯的工作。 另一位评论员开玩笑地说,“not just”这个短语被过度使用,取代了破折号,进一步突出了可能源于人工智能影响的文体怪癖。这场对话凸显了人们对潜在由大型语言模型创作的内容日益增长的怀疑。

🛡️ 安全验证 我们正在检查您的连接以防止自动化滥用 ⏳ 正在验证您的浏览器... 为什么我看到此验证? 有问题吗?联系支持 验证并继续 ✓ 验证完成 此页面将在片刻后自动跳转...

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 科学家发现月球近期有构造活动 (phys.org) 7点 由 bookmtn 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

2026年2月,I2P匿名网络遭受了一次大规模的Sybil攻击,涌入了70万个恶意节点——比其通常的15,000-20,000个活跃用户增加了39倍。最初怀疑这次攻击是过去几年(2023年和2024年)国家赞助的干扰活动的延续,但令人惊讶的是,它被追踪到Kimwolf僵尸网络。 Kimwolf于2025年12月发起过创纪录的DDoS攻击,在研究人员攻陷其主服务器后,试图建立备份的指挥和控制基础设施时,意外地将I2P作为目标。 I2P团队迅速响应,仅六天后发布了2.11.0版本。该更新显著地默认启用了后量子密码学——这是生产级匿名网络的首次——同时还包括Sybil缓解改进和基础设施升级,从而增强了网络的弹性。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 一个僵尸网络意外摧毁了I2P (sambent.com) 7点 由 Cider9986 1小时前 | 隐藏 | 过去 | 收藏 | 1条评论 帮助 gnabgib 15分钟前 [–] 这似乎缺少完整的故事,尽管标题很醒目。 Krebs的报道更深入 (39点) https://news.ycombinator.com/item?id=46976825 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

一个 Hacker News 的讨论围绕着当 AI 代理造成损害时的责任问题,特别提到了 reading.sh 上的一篇文章,该文章讨论了 AI 可能“烧毁生产环境”。 对话强调了与雇用机器人承包商的类比——如果你授予 AI 代理广泛的访问权限,并且它做出有害的更改,责任由 AI 的创建者*和*授予访问权限的用户共同承担。 进一步的评论提出了 AI 将受版权保护的代码引入项目的问题,并得到一个愤世嫉俗的回应,认为只有在检测到时才会产生责任。一位用户也指出违反了 Hacker News 的关于自我宣传的规定,并指出原始发帖者经常分享自己的内容。 核心问题在于,在 AI 越来越自主地运作的世界中,如何定义问责制。

## 重思考循环神经网络中的反向传播 这项工作研究了标准的反向传播通过时间(BPTT)的反向传递对于训练循环神经网络(RNN)是否至关重要。作者通过推导证明,误差信号*可以*向前传播,从而无需反转序列。这种“通过时间的误差前向传播”(FPTT)涉及一个“预热”阶段来建立初始误差条件,然后迭代地重建误差轨迹。 虽然在数学上是合理的,并且已成功应用于简化的顺序MNIST任务,但FPTT存在显著的数值不稳定问题。核心问题在于当网络“忘记”信息时(循环雅可比矩阵的特征值小于1),由于雅可比矩阵求逆,误差会在前向传播过程中被放大。 尽管存在这些局限性,但该研究为了解BPTT的基本原理提供了宝贵的见解,并探索了替代学习范式的潜在途径,尤其是在神经形态硬件或理解生物学习方面。作者最终决定不再进一步开发,因为存在不稳定性,但分享他们的发现,希望能够激发未来对更有效和更具生理合理性的RNN训练方法的研究。该研究强调了RNN训练中计算成本、内存使用和数值稳定性之间的权衡。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 时间上的误差前向传播 (nicolaszucchet.github.io) 4 分,来自 iNic 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 使用Claude进行AI辅助编码的规范流程 这位开发者使用Claude Code成功的9个月经验围绕一个核心原则:**将规划与执行分离**。与典型的“提示-修复-重复”方法不同,这种方法优先进行彻底的前期工作以确保质量和控制。 流程始于**深入研究**,Claude分析相关代码并生成详细报告,保存在持久的markdown文件中。在进入**规划**阶段之前,会对报告进行*审查*以确认理解,规划也记录在markdown中。至关重要的是,计划并非立即最终确定;它会经历多个**注释周期**——开发者直接在计划中添加内联注释,修正假设并注入领域专业知识,Claude会迭代更新它。 只有在存在一个经过充分验证的计划*之后*,才会通过单个提示触发**实现**,指示Claude完成所有任务并在计划文档中跟踪进度。在实现过程中,更正简洁明了,并参考现有代码以保持一致性。 这种流程在单个、长时间的会话中进行,利用了Claude的优势(理解代码、提出解决方案),同时保持了开发者对架构和产品决策的控制。关键在于注释后的计划——一种共享的、可变的状态,确保一致性并防止浪费精力。

## Claude 代码工作流:规划与执行 最近的 Hacker News 讨论详细描述了一种使用 Claude(以及类似 LLM)进行编码的工作流,强调严格区分规划和执行。核心思想是避免直接要求 AI 编写代码,而是引导它经历一个多步骤的过程。 这包括详细的头脑风暴、创建高级和实现设计方案(通常在 markdown 文件中),然后利用代理/子代理进行任务实现、规格审查和代码审查。最终结果是用于人工审查的拉取请求。 用户强调了提示 LLM 进行“深入”理解的重要性,因为表面阅读会产生较差的结果。然而,一些开发者认为这个过程比直接编写代码*更*费力,尤其是对于经验丰富的程序员。人们也对该方法在大型代码库中变得笨重以及可能浪费 token 表示担忧。 讨论中提出的替代方案包括使用工单系统进行任务管理,以及使用 Plannotator 等工具进行方案迭代。最终,讨论指出需要受控的工作流,用户保持控制权,而不是完全依赖 AI 工具。

更多

联系我们 contact @ memedata.com