每日HackerNews RSS

这段文字讨论了优化前缀和(或扫描)操作,该操作计算数据集中值的累积总和。简单的迭代方法可以达到接近处理器最大速度,每秒处理数十亿个整数。然而,单指令多数据(SIMD)指令,例如ARM的NEON,*可以*提供进一步的改进。 最初使用朴素的SIMD实现尝试时,出乎意料地*慢于*标量方法。成功的关键在于处理更大的数据块——一次加载16个值,并并行执行局部前缀和。然后,再对这些局部和进行前缀和计算。 在苹果M4处理器上,这种“快速SIMD”方法达到了每秒89亿个值的速度,大约比标准的标量方法快2.3倍。该优化利用了交错加载和存储,以及用于向量运算的高效SIMD内联函数。

## 基于ARM NEON的千兆级前缀和:摘要 最近一篇Hacker News上的帖子讨论了一种高度优化的前缀和算法,利用ARM NEON指令,实现了每秒千兆字节的速度。核心技术在于Hillis-Steele前缀和实现中的交错加载技巧,有效地处理了通常对SIMD架构具有挑战性的顺序依赖性。 讨论的中心是该算法的泛化能力,以及与“顺序广播”和“将并行扫描作为多维数组问题”等替代方法的比较。对话的很大一部分围绕着ARM的可扩展向量扩展(SVE)及其采用情况。虽然SVE2在许多较新的ARM核心中得到支持(包括最近的智能手机和服务器中的核心),但苹果公司继续倾向于其SME/SME2扩展,优先考虑单线程性能。 贡献者还争论了使用SVE进行宽度无关编程的实用性,建议转向软件工具,根据特定硬件特性参数化代码,以实现最佳性能。最后,该主题涉及手动编写SIMD汇编是否仍然有益,一些人认为现代编译器在向量化方面非常有效。

## 意想不到的互联网与过度期待的人工智能 科幻小说在很大程度上未能预测互联网,尽管它设想了相关技术,如可视电话和在线信息访问。这种去中心化的互联内容网络,除了鲜为人知的一篇1945年备忘录外,基本上未被预见。相反,人工智能在科幻小说中已经存在了几十年,几乎总是被描绘成反乌托邦的威胁。 这种差异源于我们对技术的预期方式。作家阿瑟·克拉克区分了“预期”技术(如人工智能和机器人,长期以来一直梦想着)和“意想不到”的发明。人工智能属于“过度期待”的范畴,这意味着几个世纪以来对它到来的想象主要集中在潜在的危害上,从而加剧了公众的焦虑。 虽然当前的人工智能应用令人印象深刻,但尚未提供公众能够切实感受到的变革性益处——像Waymo这样的自动驾驶汽车是一个值得注意的例外。这导致了基于想象风险的先发制人的监管,可能扼杀创新。作者建议转变关注点:与其仅仅为潜在的危害做准备,不如积极设想人工智能的积极可能性,并考虑真正“意想不到”的技术可能出现在地平线上。

这次黑客新闻的讨论集中在人工智能快速发展对公众认知和潜在后果的影响。一个关键点是,对人工智能的恐惧并不一定基于与人工智能的*经验*,而是基于负面描绘以及对潜在弊端的日益认识——包括工作岗位流失和伦理问题。 许多评论员强调缺乏对拥有超智能人工智能的未来积极且现实的设想,认为它很可能反映出控制者的伦理道德(或缺乏伦理道德)。另一些人指出,E.M.福斯特的《机器停止》和《名为乔的逻辑》等科幻小说,是对互联网和人工智能影响出奇准确的预见。 一个反复出现的主题是对科技行业的 distrust,一些人认为,科技公司故意炒作和鲁莽实施人工智能正在*造成*公众的恐惧,而这种恐惧又因科技公司缺乏伦理考量而加剧。

## Vite 8:性能大幅提升,采用 Rolldown Vite 8 已稳定发布,这是自 Vite 2 以来最重要的架构更新。核心变化是采用了新的、统一的、基于 Rust 的打包工具 **Rolldown**,取代了先前的双打包系统(开发环境使用 esbuild,生产环境使用 Rollup)。这一转变带来了 **10-30 倍更快的构建速度**,同时保持了完全的插件兼容性。 在社区反馈的推动下——包括 Linear(快 83%)和 Beehiiv(快 64%)等公司报告的可衡量的构建时间缩短——Rolldown 提供了与 esbuild 相当的性能,并解锁了诸如完整打包模式和改进的拆分块等高级功能。 除了 Rolldown 之外,Vite 8 还引入了插件注册表(registry.vite.dev)、集成的开发者工具、内置的 TypeScript 路径别名支持,以及对关键插件(如 `@vitejs/plugin-react`)的更新。 Vite 承认自己欠 Rollup 和 esbuild 一份情,它们的基础对 Vite 的成功至关重要,并邀请贡献者进一步改进生态系统。对于大多数项目来说,升级预计会很顺利,并提供详细的迁移指南。

## 终端超链接:一项新功能 一项新功能允许在终端模拟器中直接链接URL,类似于网页。该功能由GNOME Terminal和iTerm2(基于VTE小部件)的更改发起,使用OSC 8转义序列将超链接嵌入到文本输出中。预计其他基于VTE的小部件的模拟器将很快采用它。 该系统通过识别URL并允许通过点击或菜单选项打开它们来工作。它支持各种URI方案(http、https、ftp、file、mailto)。一个关键的补充是“id”参数,它能够将多个文本片段链接为单个超链接——这对于编辑器和复杂输出非常有用。 虽然提供了便利,但也在考虑安全性。终端模拟器可能会实施保护措施,例如确认对话框或默认禁用该功能,以及URI长度限制(约2000-2083字节)。该功能旨在通过从终端直接快速访问资源(如错误跟踪器、提交ID或本地文件)来增强可用性。

## 终端超链接:安全讨论 最近有建议在终端模拟器中添加可点击的超链接,类似于网页浏览器。 这引发了争论,许多人表达了安全方面的担忧。 核心问题在于,与浏览器不同,终端本身不会验证链接网址的安全性,可能为网络钓鱼或恶意网站敞开大门,尤其是在“代理”终端应用程序日益普及的情况下。 一些终端,如Konsole,默认禁用此功能并显示安全警告。 另一些人建议终端应在鼠标悬停时显示实际网址,就像浏览器一样。 担忧不仅限于直接链接,还包括对剪贴板访问和窗口标题中现有漏洞的讨论。 虽然支持者认为这模仿了网页浏览并提供了便利性,但批评者担心这会引入新的攻击向量并使安全性复杂化。 一些人提倡用户控制的链接解析,允许用户定义受信任的协议,而另一些人则认为此功能从根本上破坏了终端的预期行为——即显示的文本是可信的。这场争论凸显了终端技术发展中功能与安全之间的紧张关系。

## 金色数据集:自信地发布人工智能 在没有彻底评估的情况下发布人工智能是有风险的,但对增长有价值。“金色数据集”是将主观改进(“似乎更好”)转化为可验证改进(“*确实*更好”)的关键。它们不仅仅是数据集,而是**带有明确评分协议的版本化案例**——超越模糊的基准,以 pinpoint 回归。 一个金色数据集包括代表性输入、预期结果和评分标准,以及与特定“变化面”(提示、模型、检索等)相关的验收阈值。 关注**与失败类别相关的多指标门槛**,而不是单一质量分数。 生产事故是宝贵的测试用例——每一个严重的事故都应该添加到数据集中。金色数据集有助于在客户、工程师或合规部门发现问题*之前*发现问题。 **主要用途:**发布前回归测试、比较变体以及确保更改不会降低关键行为,例如安全性、准确性或成本。从小处着手,关注行为类别(成功、拒绝、回退),并在可能的情况下利用确定性断言。 最终,金色数据集并非监控的替代品,而是至关重要的发布门槛,确保人工智能的改进是真实的,并且不会带来不可接受的成本。

这个Hacker News讨论围绕一篇名为“黄金数据集:概率系统的回归工程”的博文展开。该文章提倡一种严格的AI系统评估方法,超越简单的测试,采用“黄金数据集”——带有明确评分协议的版本化案例——以防止性能缓慢下降。 一个关键观点是作者认为AI可以在*没有*传统评估的情况下发布,但后果是不可避免的。一位评论员批评了文章的写作风格,认为其重复且过度依赖于简短、相似的要点,尽管旨在易于理解,但反而阻碍了清晰度。他们觉得核心信息迷失在“未经编辑的粗糙文笔”中。 作者对最初赞扬文章开头几行的评论做出了积极回应。这场讨论强调了严谨评估的重要性,以及将评分视为核心工程实践,而非仅仅是形式,以维持AI系统的可靠性。

## 出版恐惧与拥抱“愚蠢”想法 一位作家发现自己因害怕出版而无法动笔,这与他们过去多产的自我形成了鲜明对比。尽管写作水平一直很好,但他们难以分享作品,觉得一切都必须是杰出的。这源于一种观念的转变:早期的作品没有期望,允许频繁甚至有瑕疵地出版——并偶尔出现精品。现在,他们面临着达到想象中标准的压力。 作者将这种情况比作诺贝尔奖获得者在“伟大”作品之后难以再创佳作,以及持续探索“小”想法的重要性。他们强调,创新往往始于看似荒谬的概念,并举了科技历史甚至进化的例子——水母通过无数次“失败”的迭代而繁荣。 最终的关键是将重点从*质量*转移到*数量*。就像头脑风暴产生坏想法以达到好想法一样,目标应该仅仅是*创造和分享*,即使不完美。作者意识到他们需要重新找回早期自我的勇气——一个不害怕看起来“愚蠢”并 просто享受创作过程的人。这不仅仅是关于天赋,而是关于克服被评判的恐惧的意愿。

启用 JavaScript 和 Cookie 以继续。

最近的 Hacker News 讨论赞扬了 Flickr 率先采用的创新技术。用户们回忆了 Flickr 革命性的影响,特别是它早期对 AJAX 和内联编辑的使用——这些技术深刻影响了 Bootstrap 和 jQuery 等库的开发。 对话强调了 Flickr 的开放 API 和“机器标签”系统,它允许与 Last.fm 等其他平台无缝集成,使用户能够分享活动照片并创建互联的 Web 体验。那个时代的 Web 强调互操作性和开放 API,与如今更封闭的生态系统形成对比。 除了用户体验之外,讨论还涉及了 Flickr 的后端架构(详见《Building Scalable Web Sites》)以及它早期对功能开关的采用。参与者指出,这些功能现在很常见,但在当时是开创性的,展示了 Flickr 在 Web 开发领域的真正创新作用。

3分钟挑战:认识罗比,一个极其字面的机器人。罗比会完全按照你的指示执行——没有假设,没有常识,不会“自行领悟”。大多数人认为他们可以解释一个简单的过程。大多数人是错的。免费。无需注册。大约需要3分钟。由Deliberate Company打造。

## PB&J 机器人挑战:黑客新闻讨论 一个网站链接,挑战用户指示机器人制作花生酱果酱三明治,在黑客新闻上引发了热烈讨论。其核心思想——详细说明*每一个*步骤,无论多么显而易见——突出了将人类理解转化为机器精确指令的困难。 许多评论员将此练习与教育工具联系起来,例如日本节目“Texico”,它使用类似的情景来教授逻辑思维并为儿童准备编程。还有人回忆起童年教训,甚至有父亲搞笑地按照孩子们的字面指示行事。 对话涉及编程和人工智能的更广泛影响。一些人指出,这项挑战反映了为软件指定行为的复杂性以及当前大型语言模型的局限性。一些人认为,这项练习强调理解你的受众和挑战假设的重要性,而另一些人则认为,鉴于人工智能的进步,它已经过时。最终,讨论强调,即使是看似简单的任务,也需要极其详细和细致的指令才能让机器人成功执行。

## 闹钟的历史 可靠地叫醒人们的尝试由来已久,最早可追溯到公元前5世纪,古人将水钟(clepsydra)改造成闹钟。哲学家柏拉图率先设计了一种利用受困空气产生口哨的版本,而后来的改进则通过排水盆自动敲响村庄的钟声。 机械钟出现在13/14世纪,最终在敲钟前加入了音乐旋律,到了15世纪,带有别针设置闹钟的装置出现在家庭中。尽管个人在17世纪就开始尝试闹钟机制,但第一台获得专利的机械闹钟直到1876年才问世,但价格昂贵且不可靠。 工业革命推动了对准时的需求,催生了“敲门唤醒者”——他们亲自叫醒工人。这突显了几个世纪以来,对可靠闹钟的追求随着社会需求和技术进步而不断发展。

## 自然醒:黑客新闻讨论 一篇最近的BBC文章,关于人们在闹钟响起前醒来的情况,在黑客新闻上引发了一场讨论,揭示了人们对自然睡眠-觉醒周期的不同体验。许多评论者强调了与日出和日落对齐的重要性,这在工业化前的社会中是一种常见的做法。 一些用户报告说,通过建立规律的就寝时间表并让身体调节醒来时间,成功地在闹钟响起前醒来,通常在日出前后一小时内。另一些人发现,灵活的工作时间,特别是远程职位,能够支持这种自然节奏。然而,体验各不相同——有些人始终在“备用”闹钟响起前醒来,而另一些人即使将闹钟定得较晚,仍然需要闹钟。 对话还涉及了现代生活的影响,包括人造光和固定工作时间表的压力。一些人哀叹难以维持自然周期,尤其是在晚上有安排的情况下,而另一些人则分享了诸如日落/日出照明等策略来帮助睡眠。一个历史记录指出,在没有电力的情况下,人们因为照明成本的原因会随着太阳下山而睡觉。最终,该讨论强调了睡眠的个体性,以及优先考虑规律的睡眠时间表,而不是强迫醒来的重要性。

许多电脑评测关注的是设备适合*谁*,实际上是在限定可接受的追求。新款MacBook Neo,售价599美元,被定位为一台基础机器——Chromebook的竞争者,入门级笔记本电脑——评测者正确地指出了它在专业任务上的局限性。然而,这忽略了重点。 真正的学习和痴迷并非源于拥有*正确*的工具,而是源于突破现有条件的限制。Neo,尽管存在限制(8GB内存,A18 Pro芯片),但仍然是一台完整的Mac,提供完整的macOS体验和实验自由——甚至可以尝试破坏。 它的局限性不是阻碍,而是计算基础知识的学习。与封闭系统不同,Neo允许用户发现*为什么*某个东西无法工作,从而培养真正的理解。它是一款面向有抱负的创作者的机器,适合那些会无情探索、下载所有内容、并将硬件推向极限的孩子——不是为了立即获得成果,而是为了在过程中学习。它不是关于优化现有的工作流程,而是关于发现可能性,并最终,*成为*更好的自己。

更多

联系我们 contact @ memedata.com