每日HackerNews RSS

正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1766243011-JGZf5kGM5laF5cUe8SCFf7MBZKaHFni0 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1766243011-JGZf5kGM5laF5cUe8SCFf7MBZKaHFni0

## Gemini 3 Pro 挑战《宝可梦晶版》:总结 最近在 jcz.dev 上详细记录的一项实验,通过让 Google 的 Gemini 3 Pro 模型玩《宝可梦晶版》来探索其能力。结果表明,Gemini 3 Pro 在游戏导航方面显著优于其前身 2.5 Pro,但成本也相当高,API 使用费用估计约为 22,560 美元。 主要发现强调了 Gemini 3 Pro 改进的推理能力,特别是它挑战初始假设和“跳出框框思考”的能力——通过正确识别一个隐藏的洋葱地址来证明。该模型还表现出谨慎的推理倾向,这可能源于专注于避免“越狱”的训练。 然而,该实验也引发了关于预训练数据作用的讨论。人们担心改进可能源于模型在网上遇到过解决方案,而不是真正的泛化能力。高成本和“刷分”基准测试的可能性也被指出,以及对现代前端开发复杂度高于后端任务的观察,以及人工智能模型中智能成本的整体下降。

Dragonwing QRB2210集成了AI加速、高效性能,并支持摄像头、显示屏和音频,专为下一代机器人和物联网产品而设计。凭借四核2.0 GHz CPU、Adreno GPU和2x ISP,它将UNO Q变成一个功能先进、成本效益高的紧凑型平台,例如机器视觉。

## Arduino 与 Qualcomm:格局变化 Qualcomm 收购 Arduino 引起了创客社区的讨论。新的 Arduino UNO Q 旨在通过结合传统 MCU 和 Qualcomm 四核应用芯片,将高性能计算与实时控制结合起来。然而,人们的担忧集中在 Qualcomm 的许可变更上,特别是关于云服务方面,导致了“劣质化”的指控。 讨论凸显了 Arduino 作为品牌/企业与“Arduino”作为使用开源 Arduino API 的电路板通用术语之间的紧张关系。虽然硬件仍然是开源的,但新的云服务条款正在引发警惕,尤其是对于开源项目而言。 许多评论员指出 Qualcomm 过去的惯例,并质疑他们是否理解 Arduino 社区的核心价值——易用性和可访问性。BeagleBoard BeagleY-Ai 和 Zephyr RTOS 等替代方案正在被讨论,但 Zephyr 本身也因其复杂性而受到批评。最终,社区正在谨慎观察 Qualcomm 是会培养还是扼杀 Arduino 的精神。

## Immersa:3D演示工具概要 Immersa是一个基于Web的动态3D演示文稿制作工具。它不同于传统的幻灯片软件,允许用户导入和排列3D模型(.glb)、图像和3D文本于场景中。其核心创新在于其自动动画系统:只需复制幻灯片,重新定位对象,Immersa就会生成平滑的过渡效果。 该编辑器具有3D视口、幻灯片缩略图和对象属性面板。它支持撤销/重做、键盘快捷键和现代深色UI。演示文稿使用IndexedDB本地存储在浏览器中,确保数据持久性。 Immersa使用ClojureScript、Reagent和Babylon.js构建,提供了一种独特的方式来吸引观众,并呈现视觉上引人入胜的动画演示文稿。项目可以导出为.edn文件以供后续使用。项目和演示可在[https://github.com/ertugrulcetin/immersa](https://github.com/ertugrulcetin/immersa)找到。

## Immersa:开源3D演示工具 - 摘要 Immersa是一款新的开源的基于Web的3D演示工具,最近在Hacker News上分享。它使用一个令人惊讶的小代码库(4.4k SLOC)构建,允许用户创建包含3D元素和转场的演示文稿。 讨论中将其与苹果Keynote的“Magic Move”功能进行了比较,并探讨了将其发展为简单3D电影制作器的可能性。用户建议将其应用于建筑、产品设计等领域,以及增强一般演示文稿的视觉效果。 有人对用户体验提出了担忧——特别是每个转场都需要新幻灯片这一决定——但创建者欢迎贡献以改进它。一些评论员指出,Readme似乎大部分是由LLM生成的,并表示更喜欢人工编写的文档。讨论时,演示网站(immersa.app)被报告为无法访问。用户还要求提供将演示文稿导出为常见视频格式的选项,以及提供可下载的二进制文件以供离线使用。

最近Brian Greene和Edward Witten之间的讨论揭示了弦理论长期以来的停滞。作者认为,这次对话重提了数十年来的旧观点,却没有取得进展。值得注意的是,Witten承认“人类尺度景观”——即宇宙的性质仅仅是允许我们存在——的出现最初让他感到不安,因为它与他想要*解释*基本物理学,而不是仅仅接受它的愿望相冲突。 Witten回忆说,他多年来一直对这一含义感到不满,最终接受了缺乏便捷解释的事实。作者认为这是一种拒绝承认弦理论的局限性,一个数十年前本可以改变方向的节点。 现在,任何这样的改变似乎都已不可能,Greene和Witten似乎都致力于延续这个理论,尽管它缺乏经验支持。作者批评Greene将批评驳斥为出于“其他议程”,并将整个交流描述为强化了一个失败的想法。

## 弦理论:50年回顾 Hacker News 的讨论集中在弦理论上,这是一种试图将引力与量子力学统一起来的物理框架。虽然最初很有希望,但它因缺乏可检验的预测而受到批评。许多评论者认为核心问题不是*缺乏*预测,而是它能够产生*几乎任何*预测,使其难以证伪。 这场争论凸显了该领域的转变。最初,弦理论旨在做出具体的、后来被证明是错误的预测,从而导致越来越灵活的迭代。一些人认为它已成为一种数学工具,而不是真正的理论,可能对探索理论可能性有用,但缺乏实际应用。 人们对研究经费的分配表示担忧,质疑资源是否应该花在其他方法上。尽管如此,一些物理学家为弦理论的价值辩护,认为其数学优雅以及潜在的、意想不到的应用,即使直接的实验验证仍然遥远。讨论还涉及了科普作品的影响以及该领域内可能存在的偏见。

## Semistable::vector: 动态容器的稳定迭代器 `semistable::vector` 是一个C++头文件库,提供了一个 `std::vector` 的即插即用替代方案,但具有关键的区别:**迭代器稳定性**。标准的 `std::vector` 迭代器在插入或删除时可能会失效,甚至在失效元素之前。`semistable::vector` 保证迭代器在这些操作之后仍然有效,使用 `std::shared_ptr` 通过“纪元”系统跟踪元素。 这种稳定性是通过在修改向量时创建新的纪元描述符来实现的,迭代器内部指向它们被创建时的当前纪元。这确保了即使在向量修改的情况下也能进行一致的解引用。 基准测试表明,在使用通过 `raw()` 成员函数获得的原始指针进行遍历和排序等操作时,性能与 `std::vector` 相当。虽然 C++20 引入了连续迭代器以实现潜在的性能提升,但当前标准库实现很少利用它们。 该库对于常量操作是线程安全的,但需要谨慎处理并发迭代器使用。未来的开发可以解决长期迭代器的异常安全性和内存管理,并且使用 `boost::local_shared_ptr` 的单线程版本展示了性能改进。

一位开发者在Hacker News分享了一个“半稳定”C++向量容器的概念验证,可在GitHub上找到。与标准向量不同,该实现旨在允许在迭代的同时追加数据,而不会使现有迭代器失效。 讨论集中在使用场景和权衡。虽然标准向量提供快速的随机访问,但它们在插入时需要数据移动,可能导致迭代器失效。这种半稳定向量优先考虑迭代器稳定性和追加性能,但代价是随机查找速度略慢,并且可能占用更多内存。 评论者争论其实用性,一些人质疑在迭代过程中修改向量的必要性(通常不鼓励的做法),而另一些人则认为它在特定场景中可能有用,例如可热插拔的代码或引用计数数据管理。将其与现有的数据结构(如`std::list`甚至Emacs标记)进行了比较,突出了这种方法的利基性质。

## Go Map 优化:`struct{}` 的误解 开发者经常使用 `map[int]struct{}` 作为 `map[int]bool` 的内存节省替代方案,用于跟踪唯一的整数,利用空结构体的零字节大小。然而,从 Go 1.24 及更高版本开始,这种优化不再有效,因为 map 的实现发生了变化。 在 Go 1.24 之前,map 将键和值存储在单独的数组中,允许 `struct{}` 完全消除值数组。但随着 Go 1.24 引入 Swiss Table,map 现在使用不同的结构,其中每个槽都需要对齐。`bool` 和 `struct{}` 都占用 1 字节,但对齐要求强制为 `struct{}` 槽添加 7 字节的填充,导致其内存占用与 `bool` 相同。 可以通过检查 Go 的源代码来轻松验证此行为,由于该语言的自托管编译器,源代码是可访问的。作者的调查发现了这个问题,揭穿了常见的建议,并强调了验证信息的重要性,即使是 LLM 也错误地声称该优化仍然有效。最终,使用 `struct{}` 现在牺牲了可读性,而没有提供内存优势。

## Go Map 变更与集合实现讨论 最近 Hacker News 上出现了一场关于 Go 的 map 实现变更的讨论,该变更影响了将 map 作为集合使用时的内存占用(map[T]struct{} 或 map[T]bool)。新的实现似乎使用了更多的内存,尽管 Go 团队以其精心的设计和优化而闻名。 对话涉及“自托管编译器”是否能带来实际优势——作者可以阅读代码,但这并不一定能改进实现。关于 Go 团队的优先级存在争论,一些人批评了增加内存消耗的变更,同时似乎淡化了向标准库添加专用 `Set` 类型(之前曾有添加 Set 的尝试被拒绝)。 参与者强调了 API 变更(为了兼容性而小心维护)和实现变更(更灵活)之间的区别。空 struct 与布尔值作为 map 值的用法也进行了讨论,有人认为空 struct 在表示集合成员资格方面更清晰。最后,该讨论强调了即使在评估来自看似可靠来源(包括 LLM 和经验丰富的开发者)的信息时,保持怀疑和验证的重要性。

## 太赫兹信号突破,利用“量子天线” 华沙大学的研究人员开发了一种新方法,可以准确测量太赫兹(THz)辐射——电磁波谱的一个区域,具有先进成像和6G通信等巨大应用潜力,但历史上难以精确测量。他们的方案利用制备成高灵敏度“量子天线”的“里德堡原子”。 这个创新系统不仅*检测*太赫兹信号,还精确*校准*了该范围内的“频率梳”——一种超精确的电磁标尺。通过将微弱的太赫兹信号转换为可检测的光,并利用里德堡原子固有的校准能力,该团队首次成功测量了太赫兹频率梳的单个“齿”。 这一突破克服了太赫兹计量学中的一个主要障碍,为校准仪器提供了一个参考标准,并实现了高度精确的测量。重要的是,该系统在室温下运行,为经济高效且具有商业可行性的太赫兹技术铺平了道路,并为这个激动人心的领域的研究和开发开辟了新的途径。

一种新的量子天线,利用里德堡原子,能够更精确地测量太赫兹 (THz) 频率——一个以前难以触及的范围。这项突破允许进行精确的光谱分析,通过分析材料与太赫兹辐射的相互作用,揭示材料的化学成分信息。 与捕获大面积能量的传统天线不同,这种方法在单个点检测电磁振荡,即使对于微弱信号也能产生极其灵敏的读数。它并非能够进行宽带接收的传统“无线电接收器”,但擅长测量特定频率。 讨论的重点在于实际应用,包括潜在的无损扫描(取代X射线)和天文观测(由于大气干扰,需要基于太空的仪器)。一个关键的挑战仍然存在:开发有效处理更宽太赫兹信号带宽的方法,以便使用现有电子设备进行更全面的分析。

## 重新构想面向现代硬件的数据库 核心问题是:如果利用90年代以来的进步——特别是快速的本地SSD和强大的云基础设施,我们今天应该如何从头设计一个关系数据库? 当前的数据库是为慢速旋转磁盘构建的,优先考虑诸如预写日志和批量缓冲等技术。 分析表明,有几个关键的改变。 首先,**缓存大小**应侧重于预期访问的30秒到5分钟窗口,尽管存储速度已大大提高,但这仍然符合Jim Gray的“五分钟规则”。 其次,**传输大小**应以大约32kB为目标,以最大化SSD吞吐量。 至关重要的是,**持久性**从对本地磁盘的依赖转变为跨可用区进行分布式复制,并接受由此产生的延迟以实现强一致性。 这会影响**隔离**策略,倾向于像Aurora DSQL这样的方法,即推迟跨AZ的通信到提交时间。 最后,对**预写日志**的传统依赖性,用于单系统持久性,变得不那么重要,取而代之的是基于分布式日志的恢复。 虽然SQL和原子性等核心关系原则仍然有价值,但重点转移到分布式系统关注的问题上,例如规模、可用性和性能。 现代数据库应优先优化实际网络条件和应用程序架构,利用诸如高质量时钟来实现一致性等功能。

## 为固态硬盘重新思考数据库 这次Hacker News的讨论集中在当前数据库设计是否针对现代固态硬盘进行了优化。核心论点是,许多数据库架构是在旋转磁盘的限制(慢速I/O以及顺序访问和随机访问速度之间的显著差异)下构建的,尚未完全适应固态硬盘的能力。 虽然固态硬盘提供更快、更一致的性能,但有人认为,依赖诸如预写日志和缓冲之类的传统技术可能是不必要的,甚至是有害的。一个关键的争论点在于耐久性和性能之间的权衡:一些人提倡优先复制而非单磁盘一致性的分布式系统,而另一些人则强调本地、快速提交的重要性。 许多评论者强调了固态硬盘的磨损问题以及协调跨多个系统的写入的复杂性。还有人指出,诸如持久内存(Optane)和创新数据库设计(如Aerospike、dbzero和LeanStore)等新兴技术正在尝试解决这些问题。最终,讨论表明需要根据不断变化的存储环境重新评估数据库的基本假设。

## Codex Agent Skills:扩展AI能力 Codex Agent Skills 通过添加特定任务的专业知识来增强 Codex 的功能。一个技能是一个包含指令(在 `SKILL.md` 中)、可选脚本和资源的包,使 Codex 能够可靠地执行定义的流程。技能可共享,并基于开放标准构建,可通过 Codex CLI 和 IDE 扩展访问。 Codex 通过**显式调用**(在提示中使用 `/skills` 或 `$skill-name`)和**隐式调用**(根据任务自动选择相关技能)来利用技能。技能的优先级基于其位置——从本地仓库文件夹到用户特定和系统范围的目录。 可以使用 `$skill-creator`(以及可选的 `$plan` 用于规划)或手动使用包含名称和描述的 `SKILL.md` 文件来创建新技能。预构建的和社区贡献的技能可以使用 `$skill-installer` 安装(例如,`$skill-installer linear` 用于 Linear 集成)。 最终,Agent Skills 允许用户根据其特定需求和工作流程定制 Codex,扩展其超越核心功能的能力。

## OpenAI 的“技能”现已适用于 Codex OpenAI 已经发布了适用于其 Codex 模型的“技能”,提供了一种标准化的方式来扩展其能力。技能包包含指令、资源和可选脚本,使 Codex 能够可靠地执行特定工作流程。这借鉴了 Anthropic 的类似功能,旨在提高上下文效率和可重用性。 主要优势包括易于编写(使用 markdown 文件)、利用现有工具(如 `gh` CLI)的能力,以及可组合性——代理可以加载多个相关技能来完成一项任务。技能还可以包含在沙盒环境中执行的代码(Python/JavaScript)。 讨论强调了技能的可共享性、协作改进(甚至可以由代理自身进行!)以及用于自动化数据库访问或复杂测试设置等任务的潜力。虽然有些人将其与现有的工具/函数调用和 MCP 等概念相提并论,但技能提供了一种更简单、更灵活的方法。人们对技能的可发现性、安全性以及货币化表示担忧,但总体而言,社区对标准化、可重用的 AI 工作流程的潜力感到兴奋。

## Sharp:JavaScript 的高速图像处理 Sharp 是一个 Node-API 模块,专为极速图像转换和处理而设计。它擅长将大型图像调整为适合 Web 的格式,如 JPEG、PNG、WebP、GIF 和 AVIF,其速度比 ImageMagick/GraphicsMagick 快 4-5 倍,这归功于它使用了 libvips。 Sharp 兼容 Node.js、Deno 和 Bun(需要 Node-API v9 支持),能够准确处理色彩空间、ICC 配置文件和透明度。它通过 Lanczos 重采样提供高质量的缩放,以及旋转、提取、合成和伽马校正等功能。 在现代系统中,安装通常无需依赖。该模块支持文件和缓冲区输入/输出,并可集成到流式处理管道中。详细文档、基准测试和安装指南可在 sharp.pixelplumbing.com 找到。它是开源的,采用 Apache 2.0 许可。

## 图像处理库 Sharp 讨论 一篇 Hacker News 讨论强调了 **Sharp**,这是一个高性能的 Node.js 图像处理和优化库。用户一致称赞其速度和实用性,许多人报告在个人和专业项目中的长期成功应用——包括网站自动调整大小(benhouston3d.com, threekit.com)以及与 CloudFront 集成,通过 Lambda 函数进行实时图像处理等用例。 虽然普遍受到好评,但一些用户指出 API 可能“有点奇怪”,有时需要转换才能重新加载更改。 讨论还提到了 **libvips**,这是 Sharp 的底层引擎,以及最近的 libvips 版本 (8.18.0) 添加了对 UltraHDR 和 RAW 图像等新图像格式的支持,预计这些功能将在未来六个月内出现在 Sharp 中。 总而言之,共识是 Sharp 是一个可靠且强大的大规模图像处理工具。

更多

联系我们 contact @ memedata.com