每日HackerNews RSS

库伯·梅塔是一位才华横溢的19岁人工智能开发者,来自印度新德里,目前正在印度顶尖大学学习计算机科学、人工智能与数据科学。他是Perplexity AI商业研究员,并且活跃于OpenAI亚太开发者社区。 库伯拥有丰富的黑客马拉松经验——参加过20多场,包括赢得Nothing Essential Lab S1黑客马拉松,并在Unsloth x AMD强化学习黑客马拉松中获得第四名。他因创新项目而备受认可,例如**PolyThink**(多智能体人工智能)、**TREAT**(触发检测),以及特别的**Backdooms**——一个完全功能的DOOM游戏,嵌入在二维码中——该项目曾被《独立报》、《PC Gamer》等媒体报道。 他还正在开发**MEOW**,一种适用于人工智能时代的下一代图像格式,以及众多其他人工智能/机器学习和Web开发项目。库伯精通多种技术,包括Python、JavaScript、TensorFlow和AWS。 他的作品可以在[GitHub](https://github.com/Kuberwastaken)和[Portfolio](https://kuber.studio/)上找到。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交 登录 展示 HN:互联网上的终端风格作品集 (kuber.studio) 8 分,kuberwastaken 1 小时前 | 隐藏 | 过去 | 收藏 | 2 条评论 去年发布过,之后学习了很多,改变了很多,仍然可以肯定地说,这是互联网上最好的终端风格作品集网站。 IdontKnowRust 2 分钟前 | 下一个 [–] 我想如果你能选择常见的 Linux 命令,比如 ls、whoami,一个有意义名称的脚本来运行并打印你的简历,而不是通过 lireplyl 跳转到 LinkedIn,那会很酷。 stodd 21 分钟前 | 上一个 | 下一个 [–] 非常好。如果你能移除 https://fonts.googleapis.com/css2?family=JetBrains+Mono:wght... 依赖并减少 apple-touch-icon.png 的大小,那就完美了。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Chrome应对量子抗性HTTPS的计划 Chrome正在主动为量子计算机对当前HTTPS证书安全造成的威胁做准备。Chrome没有直接将量子抗性密码学实现到传统的X.509证书中——这将显著增加带宽使用量——而是率先采用**Merkle树证书 (MTC)**。 MTC提供了一种更高效的解决方案,它用紧凑的“证明”取代了冗长的证书链,以验证包含在认证机构 (CA) 签名的公共树中。这在增强安全性的同时,保持了速度和透明度。 Chrome的推广分为三个阶段:**阶段1 (正在进行中)** 是与Cloudflare进行的可行性研究,并以现有的X.509证书作为安全保障。**阶段2 (2027年第一季度)** 邀请已建立的证书透明度 (CT) 日志运营商启动公共MTC。**阶段3 (2027年第三季度)** 将启动专用的“Chrome量子抗性根存储库” (CQRS) 用于MTC,与现有的根程序并行。 除了MTC的开发,Chrome将继续支持当前的CA,并探索用于私有PKI的量子抗性X.509证书。该举措旨在构建一个更快、更安全、更透明的网络基础,使其能够抵御未来的量子计算进步。

## Google 的抗量子 HTTPS 及讨论总结 Google 正在使用 ML-KEM 密码学实现强大、高效的抗量子 HTTPS,引发了 Hacker News 的讨论。焦点正在转向 Merkle 树证书 (MTC),作为后量子密码学 (PQC) 的首选方法。 主要讨论点包括:虽然证书尺寸增加 40 倍(约 160KB)对于宽带连接来说并非灾难性,但对于低带宽用户来说*可能*会比较明显,并且会显著影响高延迟或丢包的连接,尤其是在使用 HTTP/1.1 等旧协议时。 也有人对证书透明度日志的影响表示担忧。 讨论集中在优化初始拥塞窗口大小以及使用 QUIC 等较新协议的优势。 许多评论员认为,现有的网络低效和设计不良的协议才是*真正*的问题,而仅仅增加证书尺寸只会暴露这些潜在问题。 几位用户指出需要更新 Mozilla SSL Config Generator 等工具以支持 PQC 参数。 Let's Encrypt 也在积极探索 MTC 的实现。

## 决策树:总结 决策树通过创建一系列规则来对数据进行分类,将数据分割成越来越纯净的区域。这个过程的核心在于**熵**,它是数据杂质度的度量——熵越低,数据集越同质。算法旨在*最大化信息增益*,即分割后熵的减少量。 **ID3算法**计算每个可能分割的信息增益(基于特征和值),选择产生最大增益的分割。这个过程是递归的,自上而下地构建树,直到叶节点主要包含一个类别(纯净)或满足停止条件(例如最大深度)。 虽然**基尼不纯度**可以作为一种指标进行比较,但熵在不平衡数据集上可能更稳健。决策树易于解释、训练速度快且能很好地处理异常值,但容易出现**过拟合**——创建过于复杂的树,无法很好地泛化到新数据。可以通过诸如剪枝(限制树的深度/大小)等技术来减轻这种不稳定性,或者更有效地通过将多个树组合成**随机森林**来解决。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 决策树 – 嵌套决策规则的非凡力量 (mlu-explain.github.io) 16 分,mschnell 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 xmprt 发表于 3 分钟前 | 下一个 [–] 有趣的网站和精彩的演示。我唯一的建议是,部分文本的颜色对比度使阅读变得困难。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 室内植物编程:为我而写,由我而造 Hannah Ilea 提出了“室内植物编程”的概念——创建小型、个性化的软件解决方案,旨在解决*你*的具体问题,而无需追求广泛适用性。受 Recurse Center 同行的启发,这种理念拥抱“仅为自己构建”的自由,其中“在我机器上能运行”是成功,而非道歉。 这种方法与专注于生产和大规模使用的传统软件开发形成对比。就像照料室内植物一样,这些项目是为了个人享受和实用性而培育的。即使它们无法茁壮成长,或需要独特的照料也没关系——可以轻松地“堆肥”(删除)或分享给他人进行调整。 Ilea 还将“花束编程”定义为更加短暂的一次性脚本,用于执行特定任务,且不期望维护。她鼓励分享这些个人项目,提供徽章来识别它们,并重新构建围绕分享未完成或高度定制代码的心态。最终,室内植物编程是关于创造的乐趣以及软件存在的价值,仅仅是为了满足个人需求。

## Hacker News 讨论:“盆栽编程” 一篇最近发表在 hannahilea.com 上的文章引发了 Hacker News 关于个人软件项目——那些为解决个人需求而构建的“一次性”程序——的讨论。用户们争论是否一个新的术语“盆栽编程”更能体现这些通常很小、精心维护的工具的精神,而传统上它们被称为“实用工具”。 核心思想是创建软件并非为了广泛重复使用,而是为了个人享受和持续的实用性,就像照料盆栽一样。 也有人提出了“自制应用”和“生存式开发”等替代方案,一些人认为现有术语无法传达相同的个人关怀和持久性。 对话还涉及了更广泛的软件开发状态,一些人哀叹智力追求的衰落,并对人工智能的影响表示担忧——担心它会导致质量较低、快速生产的软件,而不是释放时间用于有意义的创作。 另一些人认为人工智能是一种有用的工具,但警告不要过度依赖它。 最终,许多人表达了对更多“盆栽”风格项目的渴望——小型、精心制作的工具,它们充满热情和关怀。

## 10-202:现代人工智能物流导论 - 课程概要 本课程将于2026年春季在CMU开课,介绍驱动现代人工智能(如ChatGPT)的核心机器学习方法和大型语言模型(LLM)。尽管它们很复杂,但其底层技术却令人惊讶地易于理解——学生甚至将从头开始构建一个基本的AI聊天机器人。 课程涵盖了广泛的主题,从人工智能的历史和监督学习到神经网络、Transformer以及微调、强化学习和AI安全等高级技术。课程的很大一部分涉及使用Python和PyTorch等工具进行实践编程作业,最终训练并运行一个开源LLM。 成绩评估基于作业(20%)、小测验(40%)和期中/期末考试(40%)。课程的精简免费版本将在线提供,内容发布延迟两周。学生允许将AI助手作为学习工具用于作业,但预计独立完成最终提交,并且禁止在考试中使用它们。 **先修课程:** 基本Python编程(15-112/15-122)和微积分入门(21-111/21-120)。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 10-202: 现代人工智能导论 (CMU) (modernaicourse.org) vismit2000 发表于 54 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 emil-lp 发表于 10 分钟前 [–] > 我们所说的“现代人工智能”,特指像 ChatGPT 这样的系统背后的机器学习方法和大型语言模型 (LLM)…… 这定义也太狭隘了吧。 如果你开的是 LLM 课程,就应该这么命名。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

这段 JavaScript 代码创建了网页上由特定元素触发的交互式工具提示(气泡)。它解析页面文本内容中的自定义 `[[术语|标题|内容]]` 标记,将其替换为按钮。点击或聚焦这些按钮,将显示包含与 `术语` 关联的 `标题` 和 `内容` 的工具提示。 该代码智能地将工具提示相对于触发元素定位,确保其保持在视口内,并通过调暗触发元素分支外部的区域来避免覆盖内容。它处理鼠标交互(悬停/点击)和键盘导航(聚焦、Esc 键)以打开和关闭工具提示。 该脚本还适应不同的输入方法,为触摸设备提供“粗略”模式,并包含打开和关闭工具提示的动画。最后,它在窗口大小调整或滚动事件时重新定位工具提示,以保持其可见性和位置。

## Claude 与 ChatGPT:LLM 忠诚度的转变 一则 Hacker News 的讨论显示,人们越来越愿意从 OpenAI 的 ChatGPT 转向 Anthropic 的 Claude,这并非因为 Claude 的性能更优越,而是出于对 OpenAI 伦理和先进人工智能潜在滥用的担忧。 许多用户表达了对 OpenAI 的不信任,担心其与潜在有害应用保持一致。 对话还涉及了 LLM 中“全账户记忆”的吸引力以及缺点。 虽然有些人觉得它在个性化回复方面很方便,但另一些人更喜欢每次互动都“干净 slate”,担心基于过去对话产生有偏差的输出。 用户强调了 Claude 的隐身模式为此目的带来的好处。 一个关键点是,这些服务缺乏强大的“护城河”; 切换相对容易,引发了对估值和竞争优势的质疑。 一些用户甚至质疑 OpenAI 是否会允许数据导出请求,这可能会阻碍无缝过渡。 最后,还提到了其他 LLM UI(如 Gemini)以及扩展(如 Claude 的 VSCode 集成)的实际问题。

## 使用 `uv` 和 `Dagger` 轻松构建 Python Monorepo Monorepo(单仓库包含多个项目)在谷歌和 Facebook 等大型公司很常见,但管理起来可能具有挑战性。本文详细介绍了一种使用工具 `uv` 和 `Dagger` 构建 Python Monorepo 的简化方法。 传统上,Python Monorepo 的设置很复杂,因为依赖管理和构建速度慢。然而,`uv` 简化了打包和依赖解析,而 `Dagger` 提供了一个强大的构建系统。这种组合能够实现具有端到端缓存的快速、模块化流水线。 核心思想是利用 `uv` 的 workspace 功能和 `Dagger` 以编程方式定义构建过程的能力。通过解析 `uv.lock` 文件,系统可以智能地仅复制必要源代码,避免因无关项目中的更改而触发完整重建。这是通过一个构建 Docker 镜像的 Dagger 模块实现的,利用现有的 Dockerfile 阶段并添加一层用于依赖管理。 这种方法具有维护成本低、本地和 CI 兼容性以及通过缓存实现显著速度提升等优点。虽然需要一些初始设置,但由此产生的流水线高效且可扩展,使 Python Monorepo 更易于管理和性能更高。作者鼓励查阅 `uv` 和 `Dagger` 文档以进行自定义和优化。

一个黑客新闻的讨论围绕着一篇名为“破解Python单仓库”的博文。核心内容强调了管理大型Python项目面临的挑战,以及单仓库相对于Git子模块等替代方案的优势,用户认为后者非常复杂。 多位评论者指出,Python单仓库最大的性能瓶颈不是打包,而是运行测试。作者澄清了他们的方案,使用Dagger通过仔细组装只包含相关依赖项的容器,来实现高效的测试缓存。 有些人认为这篇文章是Dagger的广告,而另一些人则认为静态类型语言对于大型代码库来说能提供更直接的好处。最终,这场讨论强调了在为大型项目选择开发流程时所涉及的权衡。

## 硬木:高性能 Parquet 解析 硬木是一个新的系统,专为高性能 Parquet 文件处理而构建,借鉴了 1BRC 的经验。其主要重点是通过并行化最大化 CPU 利用率,即使在 Parquet 格式的复杂性下也能实现高吞吐量。 硬木采用了多种技术:**页面级并行**(使用多个线程解码数据页面)、**自适应页面预取**(优先处理解码速度较慢的列)和 **跨文件预取**(重叠文件解码)。这些,以及减少分配等优化措施,显著提升了性能。 在 MacBook Pro M3 Max 上,硬木可以在约 1.2 秒内对 ~9.2GB 纽约出租车数据集的三个列求和(列读取器 API),并在约 1.3 秒内解析 900MB 的嵌套 Overture Maps 数据文件。 该项目利用 JDK Flight Recorder 进行瓶颈识别,并包含自动化性能测试,并计划使用 Apache Otava 构建自动化回归检测流水线,以确保持续的性能改进。

## 硬木:一种新的Java Parquet解析器 一个名为**硬木 (Hardwood)** 的新Java库旨在为处理Parquet文件提供一个比广泛使用的 `parquet-java` 更简单、性能更高的替代方案。开发者长期以来一直苦于 `parquet-java` 复杂的依赖结构、笨拙的API和相对较慢的性能。 硬木通过提供**零强制依赖**来解决这些问题,允许用户仅添加他们需要的压缩和日志库。初步基准测试表明,在诸如对大型数据集(纽约出租车数据)中的列求和等任务中,硬木的性能明显优于 `parquet-java`,速度达到~1.2-2.7秒,而 `parquet-java` 则较慢。 目前,硬木在处理扁平、完全解析的数据集方面表现出色,但缺乏谓词下推优化——该功能计划在未来开发中实现。该项目提供了一个性能测试框架,允许用户在自己的机器上将其与 `parquet-java` 和 PyArrow 进行比较。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 检测LLM生成文本的科学 (acm.org) 9 分,vinhnx 发表于 3 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 求助 giancarlostoro 发表于 17 分钟前 [–] 我看到很多人声称现在几乎所有东西都是人工智能,包括完全正常的视频、照片和文本。我不确定这个现象的解决方案是什么,但我们将会遇到一段时间的麻烦。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

不要陷入过时的 SQL 与 NoSQL 争论——现代数据库通常足以应对大量负载。性能问题很少源于数据库*引擎*本身,而是源于糟糕的设计选择,例如低效的查询、缺少索引或规划不周的迁移。 关键在于理解你的*工作负载*。关系数据库擅长一致性读取(如金融交易),而 NoSQL 解决方案可能更适合高容量、最终一致性的写入。 选择数据库不是为了面向未来,而是承认故障模式及其影响。过于复杂、分布式系统会引入显著的开销并可能阻碍开发。通常,一个更简单、建模良好的关系数据库会为你提供更长时间的服务。 明智的扩展首先关注数据建模和优化。优先考虑清晰性并避免不必要的复杂性。资深工程师不会测试你对数据库类型的了解,而是测试你评估权衡、理解风险以及选择最符合业务需求和团队能力解决方案的能力。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 SQL vs. NoSQL:如何在2026年回答这个面试问题 (thetrueengineer.com) 4点 由 janandonly 2小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系方式 搜索:

更多

联系我们 contact @ memedata.com