每日HackerNews RSS

## Elasticsearch:搜索引擎,而非数据库 尽管Elasticsearch很受欢迎,但它最初的设计目标是基于Apache Lucene的搜索引擎,*而非*用于事务性工作负载的主要数据库。 许多团队试图将其用作数据库,但这通常会导致意想不到的问题。 核心问题在于Elasticsearch缺乏原子事务、可靠的模式迁移和强大的查询(尤其是连接)等数据库的基本功能。 它擅长索引和搜索,但在单个文档之外的数据一致性和持久性方面表现不佳。 试图通过重试或解决方法来弥补,只会掩盖潜在的缺陷。 将Elasticsearch用作数据库会引入复杂性:由于异步刷新导致的数据不一致、需要完全重新索引的痛苦的模式更新以及有限的查询能力。 此外,它的分布式特性虽然灵活,但也需要大量的运营开销。 最终,将Elasticsearch视为数据库会损害数据完整性并增加工程成本。 它最擅长的是作为专用的搜索索引,补充真正的数据库,例如Postgres或MySQL。 一种新的解决方案ParadeDB旨在结合两者的优点——提供具有数据库正确性和简单性的开源搜索。

## Elasticsearch:尽管有尝试,但它并非数据库 一则Hacker News讨论围绕着Elasticsearch (ES) 是否应该用作主数据库的争论。核心观点是,ES 最初被设计为搜索引擎,而非数据库,尽管Elastic 努力添加类似数据库的功能(ES|QL, SQL),但它仍然受到其底层索引模型的限制。 用户指出,ES 中查询语言的增多会造成困惑,并强调了潜在问题,如数据损坏和最终一致性。虽然ES 在某些场景下*可以*充当数据库——特别是用于日志记录和快速开发——但它缺乏关键的数据库功能,如事务和强大的数据完整性。 许多评论者强调,ES 擅长作为来自主要持久存储(如Postgres 或对象存储 (S3))的数据可搜索副本。 讨论还涉及成功的数据存储演变为关系数据库功能的趋势,以及选择适合任务的工具的重要性,承认 ES 在特定用例(如全文搜索)中的优势。

## 光标浏览器的实验:批判性分析 光标最近发表了一篇博客文章,详细介绍了他们尝试使用“自主编码代理”从头开始构建一个网络浏览器,运行一周,生成了超过一百万行代码。该项目托管在 GitHub 上 ([https://github.com/wilsonzlin/fastrender](https://github.com/wilsonzlin/fastrender)),旨在测试代理编码在大型项目中的可扩展性。 尽管光标声称他们的系统允许代理在大型代码库上并发工作,冲突最小,并“取得有意义的进展”,但独立分析表明该项目**无法运行**。代码无法编译,充斥着错误和警告,并且在其历史记录中没有成功构建的证据。 尽管将这项工作定义为“构建浏览器”,但光标并未声称它*有效*,而是依赖于含糊的语言和一张截图。批评者认为这造成了一种误导性的成功印象,但没有提供可重现的演示,甚至没有提供可编译的代码版本。 核心主张——即扩展自主编码是乐观的——仍然没有得到证实,因为输出虽然数量庞大,但缺乏一个可运行浏览器的基本功能。

加拿大已通过与中国建立新的战略伙伴关系,并重新开放边境给中国电动汽车(EV),从而与美国的贸易政策明显分道扬镳。总理卡尼宣布了一项协议,允许每年配额49,000辆中国电动汽车——约占加拿大市场的3%——并以6.1%的降低关税,这与之前与美国保持一致的100%关税形成鲜明对比。 该协议旨在为加拿大消费者带来更实惠的电动汽车选择,例如比亚迪海鸥,重点是价格低于35,000美元的车辆。作为回报,中国将降低对加拿大菜籽的关税,并解除对龙虾和螃蟹出口的限制。 重要的是,该协议还寻求通过合资企业吸引中国对加拿大国内电动汽车供应链的投资。此举优先考虑可负担的气候解决方案,并可能提高加拿大的竞争力,尽管可能会与美国保护主义立场产生摩擦。它表明愿意在经济利益与获取全球竞争力的电动汽车技术之间取得平衡。

能够为开发者构建产品并回馈开源社区是一种特权。同时,我喜欢与经验丰富的工程师团队合作,这让我始终保持进步,并不断挑战自己成为一名更好的工程师。 保罗·帕利丘克,软件工程师,现有员工。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Zep AI (代理上下文工程,YC W24) 正在招聘前沿部署工程师 (ycombinator.com) 1天前 | 隐藏 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

Exasol 最近推出了其大数据分析数据库的免费版本“Exasol Personal”,引发了 Hacker News 的讨论。一位用户指出,他们之前由于技术限制,难以将 Exasol 与 ClickBench 基准测试工具集成,但现在看到了新的可能性。 然而,一个许可条款最初引起了担忧——它禁止在未经 Exasol 同意的情况下发布基准测试结果。Exasol 团队回应说,这可能源于较旧的企业许可协议,他们愿意允许 ClickBench 集成。 用户还询问了“Personal”版本和 Docker 版本之间的区别;关键区别在于移除了 Docker 中存在的 10GB 数据限制,使“Personal”版本更适合大型数据集和更严格的测试。 许多用户表示有兴趣尝试新版本用于概念验证和社区项目。

## 在 macOS 上禁用 Siri 和 Spotlight:有限的成功 许多 macOS 用户质疑 Siri 和 Spotlight 的必要性,但完全禁用它们却出乎意料地困难。官方上,Siri 可以通过“系统设置”(禁用“Siri 请求”)停用,但核心进程仍然活跃。同样,在设置中禁用 Spotlight 选项并不能完全停止索引或搜索。 最有效的方法是使用终端命令 `sudo mdutil -a -d`,它禁用索引 *和* 搜索。然而,即使这样也不能消除所有相关进程——它们仍然在启动时和“活动监视器”中出现。命令 `sudo mdutil -a -i off` 可靠性较低,经常无法停止搜索。 最终,macOS Tahoe 不允许完全移除这两个功能,除非进行高级系统修改并禁用系统完整性保护 (SIP)。最佳方法是通过设置和 `sudo mdutil -a -d` 命令来最小化它们的使用,并承认仍然会存在残留。

## macOS Tahoe:对系统服务的控制与担忧 一则 Hacker News 讨论集中在 macOS Tahoe 中禁用诸如 Spotlight 和 Siri 等系统级服务日益困难的问题上。用户表达了对苹果限制的不满,认为应该赋予用户对其电脑更大的控制权。 核心问题是苹果决定限制对位于“系统”文件夹中的服务的修改,引发了对恶意软件可能性的担忧与用户自主权之间的冲突。虽然一些人承认安全方面的理由,但许多人认为苹果过于保护,阻碍了定制和故障排除。 通常需要禁用系统完整性保护 (SIP) 才能获得更深层次的控制,但这需要禁用全盘加密 (FileVault),从而产生安全困境。Spotlight 的性能和索引问题也是一个主要痛点,一些人选择使用第三方替代方案。 这次对话凸显了一种日益增长的观点,即 macOS 正在变得对高级用户越来越不友好,促使一些人探索 Linux 等替代方案。最终,这场讨论强调了苹果追求安全、简化的体验与一些用户对更大控制和定制化需求之间的紧张关系。

这段代码片段处理文本内容的预览和上传(可能是一个网页)到服务器。 “预览”按钮在 iframe 中渲染内容,显示实时预览。包含错误处理,以捕获和显示预览加载期间的任何问题。 “上传”按钮通过 POST 请求将内容发送到 `/upload` 端点。它可选地包含 Turnstile token 以提高安全性(可能是一个 CAPTCHA)。上传成功后,代码接收到一个唯一的 URL(“slug”),并显示一个成功视图,其中包含指向新创建页面的链接。 上传期间的错误处理会重置 Turnstile widget(如果存在),并向用户提醒任何失败。上传按钮包含加载状态管理,以在过程中提供视觉反馈。代码还管理显示不同的视图(上传 vs. 成功),并在上传请求期间处理过期/主题设置。

## mdto.page: 快速 Markdown 分享 mdto.page 是一个新工具,用于快速将 Markdown 内容分享为网页。由 hjinco 创建,它允许用户上传 Markdown 文件并立即获得一个公开、可分享的 URL – 无需账户或静态站点生成器设置。 主要功能包括灵活的过期日期(1 天到 30 天)用于临时分享,目前免费使用。创建者正在积极寻求反馈,并计划添加诸如自定义主题和 API 支持等功能。 Hacker News 上的讨论提到了现有的替代方案,如 mdview.io、mdshare 和 peerpad,但创建者认为当前选项缺乏吸引人的设计。有人担心潜在的滥用(垃圾邮件/网络钓鱼)以及由于反机器人措施(Cloudflare Turnstile)而无法使用 `curl` 等工具使用该服务。开发者正在通过计划的 API 访问和探索滥用报告机制来解决这些问题。网站上提供了展示可用主题的示例页面。

这段CSS代码片段为Webflow项目提供了一系列实用类,用于样式控制。它专注于边距/内边距控制、文本操作和元素可见性。 主要功能包括:重置富文本元素和容器的默认边距;创建方形纵横比的类(`.div-square`);控制指针交互(`.pointer-events-off`,`.pointer-events-on`);以及在指定行数后截断文本(`.text-style-2lines`,`.text-style-3lines`,`.truncate-width`)。 该代码还定义了在不同屏幕尺寸上隐藏元素的类(`.hide`,`.hide-tablet`等),并提供了将边距和内边距设置为零或继承排版样式的简写类。最后,它包含一个用于移除滚动条的类(`.no-scrollbar`)。 多个类提供特定的边距/内边距控制(顶部、底部、左侧、右侧、水平、垂直)。

## Indy:一款新的 ADHD 支持应用 - 摘要 Shimmer,一家源于 ADHD 个人经验的公司,发布了 Indy,一款免费应用,旨在帮助用户进行结构化规划、反思和自我意识。Indy 认识到,对于 ADHD 患者来说,*持续做* 事情比 *知道* 该做什么更困难,因此它旨在通过支持“冷” (规划) 和“热” (当下) 执行功能来弥合这一差距。 该应用具有引导式未来规划、根据用户行为调整的每日/每周签到、纵向洞察追踪和问题解决提示。它利用人工智能,并非作为人类支持的替代品(例如他们现有的辅导服务),而是作为一种经济实惠且个性化的支架工具。 初步反馈褒贬不一。一些用户赞赏其对自我反思的关注以及建立系统的潜力,而另一些用户则批评其登陆页面过于冗长,缺乏具体信息。人们也对数据隐私以及使用设备上的应用程序可能带来的分心问题表示担忧。Shimmer 正在积极寻求反馈,并计划根据用户输入进行迭代。

Let’s Encrypt 现在提供有效期仅为六天多一点(160小时)的短寿命 TLS 证书,可通过 ACME 客户端中的“shortlived”配置激活。这些证书通过最大限度地减少受损私钥的影响来增强安全性,因为与传统的 90 天证书有效期和不可靠的撤销系统相比,漏洞窗口大大缩短。 与此同时,Let’s Encrypt 现在支持 IPv4 和 IPv6 的 IP 地址证书,*要求*使用短寿命时长,因为 IP 地址的性质是瞬变的。 虽然尚未成为默认设置,但 Let’s Encrypt 计划在未来几年将标准证书的有效期缩短至 45 天。这些功能的引入旨在加强整体 TLS 安全性,并依赖于自动续订流程以实现无缝采用。这项工作得到了开放技术基金和主权技术机构的支持。

## DuckDB:现代数据处理强劲引擎 DuckDB 正在迅速成为作者首选的数据处理工具,尤其是在 Python 中,反映了大多数表格数据分析向单机分析的转变。这款开源、进程内的 SQL 引擎擅长分析查询——连接、聚合,性能通常比 SQLite 或 PostgreSQL 等替代方案快 100-1000 倍。 其主要优势在于简单性:易于安装(单个二进制文件,可通过 pip 安装),符合人体工程学的 SQL 方言,具有创新的特性,如 `EXCLUDE` 和函数链,以及近乎零的启动时间——非常适合 CI/CD 和快速测试。DuckDB 可以直接查询各种格式的数据(CSV、Parquet、JSON,甚至网络 URL),并支持使用公共表表达式 (CTE) 进行复杂的管道处理,方便调试。 除了速度之外,DuckDB 还为批量操作提供完整的 ACID 兼容性,可能与湖仓格式相媲美,并允许通过 C++ 扩展实现高性能的自定义函数。其不断增长的生态系统,包括 PostgreSQL 集成,使其成为现代数据工作流程中一种多功能且日益强大的解决方案。作者使用 Splink 的经验表明,DuckDB 能够提高采用率,减少用户问题,并加速开发。

更多

联系我们 contact @ memedata.com