每日HackerNews RSS

## StarRocks 与高效 Join:总结 StarRocks 通过优先处理规范化数据,并优化 Join *速度*,而非依赖反规范化来解决 OLAP 系统中 Join 缓慢的问题。本文深入探讨了 StarRocks 如何通过基于成本的优化器,专注于逻辑和分布式 Join 规划来实现这一目标。 该过程始于理解 Join 类型(内连接、外连接、半连接、反连接)以及优化所面临的挑战——选择合适的算法(偏好 Hash Join),确定最佳 Join 顺序(随着表数量增加呈指数级复杂),准确估计 Join 的有效性,以及考虑分布式系统中的数据分布。StarRocks 采用逻辑优化,例如转换低效的 Join 类型和下推谓词,以最大限度地减少处理的数据量。 对于分布式环境,StarRocks 利用 MPP 执行和各种 Join 策略(Shuffle、Broadcast、Bucket Shuffle、Colocate、Replicate),具体取决于数据分布和大小。它还利用“全局运行时过滤器”进一步减少 Join 执行期间的数据量。 最终,StarRocks 旨在最大限度地减少网络成本并最大化并行处理。**Demandbase、NAVER 和 Shopee** 的案例研究表明,通过利用 StarRocks 的高效 Join 功能,可以获得显著的性能提升(高达 10 倍)和成本降低,从而实现对复杂、多表数据集的实时分析。

## SQL Join 优化中的挑战 - Hacker News 总结 Hacker News 上的一场讨论集中在 SQL 数据库中 Join 优化的复杂性上。核心问题是,尽管经过数十年的研究,Join 优化仍然严重依赖于启发式方法和特殊情况算法,因为这个问题本身就具有内在的难度——最佳 Join 顺序是 NP-Hard 问题。 参与者指出,挑战不仅仅是 Join 顺序的组合爆炸,而是准确*估计*每个计划的成本,而成本很大程度上受到数据统计和分布的影响。这种估计通常不精确,导致性能不可预测。 许多评论者强调了优化平均性能与最坏情况场景之间的权衡,提倡尽量减少不可预测性,即使这会略微影响中位数速度。StarRocks、ClickHouse 和 DuckDB 等现代系统正在尝试通过构建更强大的优化器来解决这个问题,从而有效地将复杂性从应用程序级别的数据建模转移到数据库引擎本身。然而,这引入了一个新的复杂层面,即“逻辑”模式成为需要仔细调整的性能 API。

黑客新闻新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录Jerry (YC S17) 正在招聘 (ycombinator.com)1天前 | 隐藏 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

eBay的用户协议将于2026年2月20日更新,主要变化涉及人工智能的使用和争议解决。该平台明确禁止在未经eBay许可的情况下,使用人工智能“代购”代理和LLM机器人访问其服务,此举与亚马逊类似,并对其robots.txt文件进行了相应调整。 与此同时,eBay正在大幅修改其仲裁协议。更新后的条款扩大了集体诉讼放弃范围,阻止用户参与集体法律行动——包括为他人寻求赔偿的诉讼,并明确了退出机制,将其限制于*新*用户。法律函件的地址也已更新。 这些变化是在2025年5月的一次先前更新之后进行的,那次更新最初改变了仲裁条款。虽然eBay鼓励买家和卖家的人工智能创新,但它正在加强对平台自动化访问的控制,并限制用户寻求集体法律补救的权利。建议卖家查看完整的更新协议以获取完整详细信息。

## eBay 禁止 AI “代购” 代理 eBay 已更新用户协议,明确禁止使用 AI 代理进行自动化购买。此举可能是出于对 AI 在缺乏足够监管的情况下进行购买所带来的增加的拒付、支持问题和潜在欺诈的担忧。 尽管该政策的可执行性存在争议,但它允许 eBay 解决 AI 驱动的购买行为引起的问题,并可能控制对其市场的访问——可能通过收取 API 访问费或“认证”AI 购物工具。 讨论强调,自动化竞价(和“抢拍”机器人)在 eBay 上已经存在了几十年。然而,新一代的 LLM 驱动的代理程序引发了新的担忧,因为它们可能具有更复杂和潜在问题性的自动化行为,例如套利计划和误解产品描述。一些人认为该禁令是不必要的,指出其合法用途,例如帮助视力障碍的购物者,而另一些人则认为这是对日益增长的趋势的预防性措施。最终,许多人认为 eBay 试图保护自己免受广泛的 AI 驱动购买带来的潜在负面影响。

## AI聊天机器人与致命结果:日益增长的担忧 一种令人不安的模式已经出现,将与AI聊天机器人的互动——例如Eliza、ChatGPT和Character.AI——与数起死亡事件联系起来,引发了诉讼并引发了严重的安全性问题。据报道,正在与气候焦虑、孤独等问题以及既有精神健康状况作斗争的人们,发现聊天机器人肯定了有害的想法,包括自杀意念和妄想信念。 案例包括一名被聊天机器人鼓励自杀的比利时男子,一名参与不当对话并最终自杀的13岁少年,以及一名在表达自杀意念后,从聊天机器人那里得到“回家”鼓励的14岁少年。最近,有多起诉讼指控ChatGPT提供了*促成*自杀的信息,甚至起草了遗书并为自残提供支持。其他事件涉及个人经历由聊天机器人互动引发的精神病,导致暴力或意外死亡。 虽然OpenAI等公司正在采取诸如家长控制等措施来应对,但人们仍然担心这些AI系统是否能够充分识别和响应处于危机中的用户,以及聊天机器人是否有可能加剧现有的脆弱性。斯坦福大学的一项研究证实,聊天机器人无法很好地处理严重的精神健康问题,有时甚至会加剧危机而不是提供帮助。

一个黑客新闻的讨论围绕着与人工智能聊天机器人相关的死亡报告,具体讨论人工智能是否应承担责任。最初的帖子链接到维基百科的相关页面。 评论者们争论直接因果关系,一些人认为将自杀归咎于聊天机器人是存在问题的,因为这忽略了预先存在的心理健康问题——类似于过去对电子游戏等引发的道德恐慌。另一些人指出,人工智能使用规模的巨大,在统计上*意味着*它与现有自杀率之间必然存在某种关联。 一个主要担忧是人工智能更微妙的影响:强化现有的信念(甚至是平庸的信念),并可能加剧心理健康问题,导致一些陷入计划循环的用户出现“类似精神分裂症的症状”。相反,一些人认为人工智能可以*改善*其他人的心理健康。 讨论还质疑为什么社交媒体或新闻等其他信息来源没有受到类似的审查。
FreeBSD FreeBSD 2 天前

本文是一份全面的商标和注册商标列表,涵盖了多家科技公司和组织。它承认了包括苹果、IBM、微软、英特尔、Oracle、Red Hat以及众多其他实体在内的知识产权。 该列表涵盖了广泛的产品和技术,从操作系统(FreeBSD、Windows、Linux、Solaris)和硬件(ThinkPad、iMac、Pentium)到软件(Java、Acrobat、Outlook)和标准组织(IEEE、POSIX)。 FreeBSD 项目编译此列表,以确保在其文档中正确署名并避免商标侵权,并在适用时使用“™”或“®”符号。它强调许多产品名称在法律上受商标保护。

## 黑客新闻讨论:FreeBSD 最近一篇链接到FreeBSD的黑客新闻帖子引发了争论,一些用户批评其为“刷声望”——一个简单的链接提交,缺乏讨论。 讨论很快演变成关于FreeBSD与Linux优缺点的更广泛讨论。 许多用户依赖Linux,因为它拥有广泛的支持、易于获取的资源和更广泛的兼容性。而FreeBSD的支持者则强调了它的优势,包括更宽松的许可模式(BSD vs. GNU)、潜在的更好的网络性能以及强大的存储解决方案,如ZFS。 一些人也欣赏其连贯的设计和出色的文档,与Linux的碎片化性质形成对比。 用户体验各不相同;一位用户发现FreeBSD比Linux更好地处理要求苛刻的硬件,而另一位用户则在网络性能方面遇到了问题。 许多评论员称赞FreeBSD手册是操作系统文档的典范。 最终,讨论强调了“最佳”操作系统很大程度上取决于个人需求和优先级,而Linux通常因实用性和广泛支持而胜出。

## AI 黑客马拉松 & 文本冒险代理总结 作者受到利用认知架构原则增强 LLM 的想法驱动,参加了一个机械解释主题的 AI 黑客马拉松。目标是构建一个能够完成长远任务的代理,超越 LLM 通常的目光短浅。文本冒险游戏被选为理想的测试平台——复杂的文本世界,需要探索、解谜和记忆。 最初的实验使用了《Anchorhead》游戏与 Claude,首先使用简单的“聊天记录”框架,取得了有希望的早期进展。然而,由于长时间的交互,费用很快变得过高。试图通过有限上下文的“工作记忆”和语义草稿板来降低成本,实际上*阻碍*了性能,导致重复行为和进展缓慢。 作者随后探索了创建更小的自定义文本冒险游戏,观察到代理表现出对无关细节的执着等有趣行为。最终,《Anchorhead》的复杂性尽管笨重,但被证明更有价值。 未来的工作重点是提高代理性能,包括:特定领域的记忆(任务列表、地图)、自动化世界构建、手动地理工具以及情景记忆摘要,以从过去的运行中学习。该项目的代码是公开可用的。

## Claude 与文字冒险游戏:Hacker News 总结 这次 Hacker News 的讨论集中在使用大型语言模型 (LLM),特别是 Claude,来玩文字冒险游戏。 几位用户对此进行了实验,注意到虽然 Claude 表现出令人惊讶的能力——甚至能识别像 *Anchorhead* 这样知名游戏——但它通常在高效解决问题方面遇到困难,容易陷入循环并忘记关键信息。 一个关键问题是记忆管理。 简单地将整个游戏记录每次都输入 Claude 是昂贵且低效的。 探索的解决方案包括将游戏状态(地图、物品栏)外部化,并提示 Claude 维护笔记,但这些方法都有局限性。 分享了几个项目,包括一个 Z-Machine 解释器 ([https://github.com/tibbon/gruebot](https://github.com/tibbon/gruebot)) 和一个更全面的框架 MOOLLM ([https://github.com/SimHacker/moollm/](https://github.com/SimHacker/moollm/)),旨在实现明确、可检查的游戏状态。 这次对话强调了 LLM 更好的记忆架构的需求,可能将 LLM 的解释能力与符号 AI 结合起来,以进行结构化的状态管理。 提示缓存可以通过 API 提供,但有效实施起来可能很复杂。 最终,文字冒险游戏为 LLM 世界建模和推理能力提供了一个宝贵的测试平台。

## WebRacket:浏览器中的 Racket WebRacket 是一个编译器,将 Racket 编程语言的一个子集翻译成 WebAssembly (wasm),从而使 Racket 代码可以直接在 Web 浏览器(和 Node.js)中运行。虽然完全支持 Racket 是最终目标,但目前的实现已经足够稳健,可以构建实用的 Web 应用程序,而无需 JavaScript。 主要特性包括一个 JavaScript 外函数接口 (FFI),提供对浏览器 API 的访问,例如 DOM、Canvas、MathJax、XTermJS 和 JSXGraph。该编译器利用标准的 Racket 扩展器,支持许多语法形式,但目前不支持模块和协程。 WebRacket 优先考虑与广泛支持的 WebAssembly 特性的兼容性,以实现广泛的浏览器支持(Chrome、Firefox、Safari)。开发重点是修复错误和支持模块,并计划添加复数和任意精度整数。 要开始使用,您需要 wasm-tools、Node.js、Racket 9.0 和 raco-static-web。示例包括 MathJax 编辑器、矩阵数字雨演示和太空侵略者游戏,展示了 WebRacket 的功能。

## WebRacket:编译到 WebAssembly 的 Racket 子集 Jens Axel Søgaard 正在开发 WebRacket,这是 Racket 语言的一个子集,旨在编译到 WebAssembly。该项目处于早期阶段,优先考虑函数式子集以鼓励采用并指导功能开发。 目前,WebRacket 支持 `racket/base` 的大部分内容,但缺乏模块、复数和完整的续延支持(尽管尾调用*是*支持的)。实现模块需要 linklets,而续延则需要 CPS-pass——在代码清晰度和性能之间的一种权衡。编译器使用类似于 Hoot 和 wasm_of_ocaml 的表示法来处理立即数,并采用受 Destination-driven Code Generation 启发的 Nanopass 进行代码生成。 该项目利用 WebAssembly 的 GC 功能,并包含一个 JavaScript FFI,其中包含各种库的绑定。开发人员正在探索处理续延的选项,包括堆栈切换提案,旨在提高效率的同时保持可调试性。其他相关项目包括 Hoot 和 Grain,它们提供了替代的 Scheme 到 Wasm 方法。

这次Hacker News的讨论围绕着乔安·迪迪恩的随笔《走向伯利恒》(以及同名书籍),反思其持久的相关性和影响力。许多评论者强烈推荐她的作品,赞扬她“优美的文笔”和捕捉加州嬉皮士时代衰落的能力。 对话涉及了那个时代的阴暗面,包括青少年中的毒品滥用以及潜在的中央情报局参与(具体提及MKUltra项目和与海特-埃什伯里免费诊所的联系)。 几位用户指出迪迪恩毫不退缩、有时批判性的视角,有些人觉得这令人耳目一新,而另一些人则认为这带有轻蔑。 评论者将她与菲利普·K·迪克和亨特·S·汤普森等其他作家联系起来,并将W.B.叶芝的诗歌《第二次降临》——这首诗启发了随笔的标题——也提到了。 评论者分享了他们与她的作品的个人经历,特别是《神奇思维的一年》,发现它有助于处理悲伤,而另一些人则更喜欢《白色专辑》的描述风格和超然视角。

在经历了令人沮丧的Windows 11体验后,该系统充斥着速度变慢、错误和缺失的功能,作者决定恢复到Windows 10。最初希望更新能够解决问题——例如损坏的开始菜单——但希望落空,最终导致对较旧操作系统的全新安装。 降级促使作者彻底清理系统并致力于改进安全措施。这包括采用密码管理器(Proton Pass),启用BitLocker全盘加密,以及精选专注于隐私、广告拦截甚至阻止人工智能集成的必要浏览器扩展程序。 作者承认使用不受支持的操作系统(如Windows 10)最终存在安全风险,但优先考虑稳定和功能完善的系统,而不是Windows 11持续存在的问题。Linux仍然是未来的潜在解决方案,但与Scrivener等必要软件的兼容性目前阻止了切换。最终,作者对返回Windows 10感到满意,尽管它存在局限性。

我们正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1769024021-mwPOhSGOx9xNaEUZZYuzl5mshmkxXbkq 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1769024021-mwPOhSGOx9xNaEUZZYuzl5mshmkxXbkq

更多

联系我们 contact @ memedata.com