每日HackerNews RSS

## 埃尔帕索气球事件:代价高昂的误判 2026年2月10日至11日,埃尔帕索因将派对气球误认为贩毒集团无人机,导致航空旅行受到重大干扰。联邦航空管理局最初发布了为期10天的飞行限制,停飞包括布利斯堡的飞机,并将医疗直升机改道至拉斯克鲁塞斯。幸运的是,限制在7.4小时内解除,但在此之前,已有15个航班取消,其他航班严重延误。 对公开数据的分析估计,此次短暂关闭造成的经济影响在**36.4万美元至87.3万美元**之间。该数字包括乘客时间损失、航空公司运营成本和机场费用。成本的大部分来自乘客时间损失的价值,估计在27.9万美元至51.8万美元之间。 然而,实际成本可能*更高*,因为该分析无法量化对军事航空、医疗物资运输、货运以及更广泛的经济涟漪效应的影响。一位地方代表估计,10天的关闭可能造成4000万至5000万美元的损失,这表明尽管此次干扰时间短暂,但仍然是巨大的。

## 埃尔帕索机场关闭:气球与激光 埃尔帕索国际机场因海关与边境保护局(CBP)部署的高功率激光武器击落一个最终被确认为派对气球而关闭,造成的损失估计为57.3万美元。 事件源于对卡特尔无人机在边境附近运作的担忧。然而,Hacker News上的评论员质疑其必要性和执行情况,指出激光在联邦航空管理局(FAA)正式关闭空域*之前*就被部署了。人们对这项技术的准备情况以及气球是否可能被合理地误认为是无人机表示担忧。 报告显示,各机构之间缺乏沟通——联邦航空管理局局长在未通知白宫、五角大楼或国土安全部的情况下关闭了空域。虽然据报道至少有一架卡特尔无人机被摧毁,但该事件凸显了联邦机构内部潜在的过度反应和功能失调。

一维元胞自动机游乐场 网格视图 规则映射 相图探索器 光锥 规则空间映射 所有256条规则的二维散点图,按沃尔夫拉姆分类着色。选择X轴和Y轴指标来探索规则空间结构。点击任意点查看详细规则信息。 X轴:熵 密度 平均场 对称性 Lyapunov 指数 压缩性 Y轴:熵 密度 平均场 对称性 Lyapunov 指数 压缩性 相变探索器 对于选定的规则,扫描初始密度从0%到100%,并绘制每个指标的变化情况。揭示相变和临界点,规则在这些点发生剧烈的行为转变。 密度:50% 随机化 项目由 @paraschopra 提供

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 1D 细胞自动机游乐场 (paraschopra.github.io) 7 分,来自 paraschopra 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

今天,我们发布了Gemini 3深度思考的重大升级,这是一种专门的推理模式,旨在突破智能前沿,解决科学、研究和工程领域的现代挑战。我们与科学家和研究人员紧密合作,更新了Gemini 3深度思考,以应对艰巨的研究挑战——这些挑战通常缺乏明确的限制或唯一的正确解决方案,并且数据通常混乱或不完整。通过将深厚的科学知识与日常工程实用性相结合,深度思考超越了抽象理论,推动了实际应用。 新的深度思考现已在Gemini应用程序中提供给Google AI Ultra订阅用户,并且首次通过Gemini API向精选的研究人员、工程师和企业提供深度思考服务。请在此处申请提前体验。 以下是我们的早期测试者正在使用最新深度思考的方式:

## Gemini 3 深度思考总结 最近的 Hacker News 讨论集中在谷歌的新型 Gemini 3 深度思考 AI 模型上,该模型通过 Twitter 帖子(以及之前在 Google 博客上)宣布。初步基准测试显示出令人印象深刻的性能,尤其是在 ARC-AGI-2 评估中达到了 84.6%——超过了 OpenAI 的 Opus 4.6 (68.8%)。一些评论员认为 Gemini 3 甚至可能“解决”ARC-AGI-2 挑战,获得超过 85% 的分数,从而赢得 70 万美元的奖金。 讨论强调了谷歌在人工智能方面的最新进展,用户报告称 Gemini 在生物学等专业领域超越了竞争对手,如 Claude 4.6。 还有关于即将发布的“Gemini 3.1 Pro”的猜测。 用户还辩论了不同 AI 模型的计算复杂性,提出从“非思考”到“最佳的 N”模型的范围,并质疑单纯的规模是否能够复制更高级“思考”模型的的能力。 也有人提到了与 GPT-5.2 Pro 的比较以及 ChatGPT 5.3 的有限可用性。

启用 JavaScript 和 Cookie 以继续。

## OpenAI 发布更快的“Codex-Spark”模型 OpenAI 发布了 GPT-5.3-Codex-Spark,这是一个专注于**速度和响应速度**的编码任务的新模型。该更新利用持久的 WebSocket 连接和推理堆栈优化来减少延迟——将开销减少高达 80%,首次标记时间减少 50%。 讨论的中心在于这是否解决了*正确*的问题,一些用户更喜欢更快*更好*的模型,而不是更快但可能功能较弱的模型。 许多评论员强调了现有的解决方案,例如 Claude 插件用于卸载任务,以及利用 GLM 4.7 在 Cerebras 硬件上的模型。 对话还涉及**更智能的模型路由**的需求(对于简单任务速度快,对于复杂任务功能强大),以及来自 Nvidia 和 Google 的定制硅对进一步提高推理速度的潜力。 大家推测 OpenAI 的策略,以及与 Anthropic 模型发布之间的一种“一较高下”的竞争。最终,用户正在等待定价细节,并评估速度提升是否以牺牲准确性为代价。

Waymo 第六代 Driver 预计将大幅扩展其自动驾驶运营,在保持顶级安全性的同时降低成本。该系统建立在七年和近 2 亿英里的自主驾驶经验之上,采用强大的多模态感知套件——高分辨率摄像头、先进雷达和激光雷达——在各种条件下提供可靠的性能,包括恶劣天气。 主要改进包括下一代 1700 万像素摄像头,提供卓越的清晰度和更宽的动态范围,以及受益于行业成本降低的激光雷达和雷达技术的进步。 集成清洁系统确保摄像头视野清晰,定制硅芯片提高处理效率。 外部音频接收器 (EAR) 通过检测警车警报器等声音进一步增强感知能力。 第六代 Driver 专为适应性设计,可以集成到各种车辆平台中,实现可扩展的生产——目标是每年生产数万台。Waymo 正在使用该系统开始完全自动驾驶运营,并预计很快将向公众开放。

## Waymo 自动驾驶取得进展 最近的 Hacker News 讨论集中在 Waymo 第六代 Driver 的持续进展,目前已实现完全自动驾驶。用户尤其对 GM 放弃 Cruise 的决定感到惊讶,尤其是在 Waymo 展示了自动驾驶技术的可行性之后。 一位前 Cruise 员工认为,GM 意识到自己在软件/传感器开发方面能力不足——制造汽车并不等同于自动驾驶系统专业知识。另一些人指出,Waymo 的成功部分归功于埃隆·马斯克的固执阻碍了特斯拉的进展。 Waymo 强调了强大的多模式感知套件(摄像头、雷达、激光雷达)对于处理罕见的真实驾驶场景的重要性,强调了对可证明安全的 AI 而言“可靠的输入”的需求。该公司正在利用其运营大规模完全自动驾驶服务的经验。

## Lean 4 与 Ensue 的协同定理证明 本文档概述了如何使用 Lean 4、Ensue 网络和专用 CLI 工具设置一个用于协同定理证明的多智能体系统。该过程利用 Claude 来协调并行工作以证明定理的智能体。 **设置:** 需要安装带有 Mathlib 的 Lean 4(使用 `elan` 和 `lake`),Rust,并从 [ensue.dev](https://ensue.dev/) 获取 API 密钥。`lean-collab-plugin` 被克隆并构建,以提供 CLI (`./bin/lc`)。配置通过 `.lean-collab.json` 文件完成,该文件指定项目详细信息、API URL 和智能体参数。为了提高性能,一个“预热服务器”(`./bin/lc warm`)至关重要,它可以将 Mathlib 预加载到内存中。 **工作流程:** 该过程从初始化证明会话 (`./bin/lc init`) 和定义定理开始。Claude 使用 `/lean-collab` 技能,然后管理智能体来分解目标、建议策略、验证它们,并最终组合一个完整的证明 (`./bin/lc compose`)。命令如 `./bin/lc claim`、`./bin/lc verify` 和 `./bin/lc decompose` 允许进行交互和控制。 **重要注意事项:** 由于并行智能体,Token 使用量可能很高;建议使用更高费率的 Ensue 帐户。建议监控进度并在智能体循环时手动干预。从较少的智能体开始,并仔细制定定理,可以帮助管理成本并提高效率。

## Claude 代码代理编排 - 摘要 Austinbaggio 开源了一个多代理编排器,用于处理复杂的、长期运行的任务,使用 LLM。它解决了单代理系统经常停滞或产生不正确结果(例如无法编译的代码)的局限性。该系统利用一个编排代理来分解任务,并行子代理来执行,以及一个订阅系统来实时共享进度和发现。 目前构建为 Claude 代码技能,该编排器已在具有挑战性的数学问题(普特南级别)上成功测试,并且适用于代码重构和研究等任务。核心思想是利用“集体智慧”,代理从过去的尝试中学习,在有限的上下文窗口内提高效率。 该项目设计为易于修改,开发者正在寻求关于潜在工作负载的反馈。目前它需要 Ensue 的 API 密钥来管理共享任务状态和订阅,但提供免费层级用于实验。一个关键的讨论点是代理如何处理冲突的目标,以及由于 Claude 代码的限制,系统依赖于轮询来获取更新。

## V8 JavaScript 属性处理:总结 V8 JavaScript 引擎使用多种内部表示方法来处理属性,以优化性能和内存使用。虽然 JavaScript 将属性大致视为键值对,但 V8 会区分 *命名属性*(如 `obj.a`)和 *索引属性*(如 `arr[0]`)。 命名属性和元素(索引属性)是分开存储的。命名属性利用 *隐藏类*(动态标识符,代表对象的结构)来实现快速属性访问,通过 *描述符数组* 将名称映射到内存位置。添加属性会触发隐藏类转换,形成一个“转换树”以提高效率。 命名属性可以是 *内联属性*(最快,直接存储)、*快速属性*(通过描述符数组访问)或 *慢速/字典属性*(灵活但较慢,用于频繁的添加/删除)。 索引属性也有不同的形式:*紧凑*(连续,高效)或 *稀疏*(带有间隙)。它们可以是 *快速*(简单数组)或 *字典模式*(用于稀疏数组或自定义描述符)。V8 还会根据元素类型进行进一步优化 – *Smi*(整数)和 *Double*(浮点数) – 以减少开销。 理解这些内部机制对于理解 V8 优化(如内联缓存)至关重要。属性类型更改可能导致“类型污染”,从而阻碍优化,这凸显了保持一致的属性模式的重要性。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 V8 中的快速属性 (2017) (v8.dev) 4 点赞 aragonite 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## MiniMax-M2.5:经济高效AI新时代 MiniMax推出M2.5,一款在编码、代理任务和办公方面表现卓越的先进前沿模型。M2.5在SWE-Bench Verified(80.2%)、Multi-SWE-Bench(51.3%)和BrowseComp(76.3%)等基准测试中获得顶分,速度显著提升——比其前代产品快37%,与Claude Opus 4.6的速度相匹配。 其关键突破在于经济性:持续运行M2.5的成本仅为每小时1美元(100 tokens/秒),或每小时0.30美元(50 tokens/秒),真正实现了“智能过于廉价以至于无法计量”。 M2.5展现出先进的推理和任务分解能力,尤其是在编码方面,它能主动规划项目架构。它在超过10种语言和20万个真实世界环境中进行训练,能够处理全栈开发生命周期。它在搜索和工具使用方面也表现出色,在复杂任务中达到专家级水平,效率提高——比以前的模型减少了20%的搜索轮数。 通过与行业专业人士的合作,M2.5在金融和法律等办公场景中取得了显著成果。目前已在MiniMax内部部署,自主完成公司30%的任务,80%的新代码由AI生成。

MiniMax M2.5 发布:SWE-bench 验证 80.2% (minimax.io) 26 分,denysvitali 发表于 43 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 mythz 发表于 18 分钟前 [–] 一直期待这个发布,因为 MiniMax M2.1 目前是我最常用的模型,因为它速度快、价格便宜,并且在工具调用方面表现出色。虽然我仍然使用 Antigravity + Claude 进行开发,但我首先选择 MiniMax 用于我的 AI 工作流程,GLM 用于代码任务,Kimi K2.5 用于深度英语分析。 尚未自托管,但我更喜欢使用中文开源模型进行 AI 工作流程,因为未来如果需要,可以自托管。我也用它来驱动我的 openclaw 助手,因为我认为它在速度、质量和成本之间取得了最佳平衡: 运行该模型每小时只需 1 美元,速率为 100 tokens/sec。如果速率为 50 tokens/sec,成本降至 0.30 美元。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 静音:评论屏蔽工具 厌倦了充满毒性的在线评论区?**静音** 是一款旨在默认隐藏评论的工具,提供更平静的浏览体验。它以样式表(“shutup.css”)的形式创建,并提供适用于 Apple 设备(iOS/iPadOS 12+)的应用以及浏览器扩展程序(Chrome、Firefox、Edge、Opera),可在大多数网站上屏蔽评论。 对于重视讨论的平台(如 GitHub),可以轻松显示评论。该扩展程序通过将样式表注入网页来工作,需要在设备的设置中激活(Safari > 内容拦截器)。 **静音** 优先考虑隐私 – 它不会跟踪浏览活动,只会定期检查样式表更新(Firefox 除外)。用户可以通过 GitHub 报告问题或贡献开发。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 闭嘴:评论拦截器 (rickyromero.com) 9 分,来自 mefengl 29 分钟前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

我们检测到您的浏览器已禁用 JavaScript。请启用 JavaScript 或切换到受支持的浏览器以继续使用 x.com。您可以在我们的帮助中心查看受支持的浏览器列表。帮助中心 服务条款 隐私政策 Cookie 政策 版权信息 广告信息 © 2026 X Corp.

更多

联系我们 contact @ memedata.com