每日HackerNews RSS

## AMD MI300X 与 Nvidia:深入现实分析 SemiAnalysis 的五个月分析显示,AMD 的 MI300X,尽管规格参数和潜在成本优势令人鼓舞,但在实际训练性能上目前仍落后于 Nvidia 的 H100 和 H200 GPU。虽然 MI300X 拥有更优的理论 FLOPS 和内存带宽,但由于重大的软件问题,这些并未转化为相应的速度。 核心问题在于 AMD 不成熟且存在缺陷的软件堆栈,需要大量的调试和定制构建——甚至对于基本功能。基准测试表明,即使在 AMD 工程师进行大量修复后,MI300X 的性能也始终低于 Nvidia 产品,有时甚至低 25%。问题范围从 GEMM 库选择错误到内存泄漏和复杂的环境标志要求。 Nvidia 通过强大的、稳定的软件生态系统 (CUDA) 以及与网络硬件的紧密垂直整合保持着明显优势。AMD 对分叉的 Nvidia 库以及不太成熟的集体通信库 (RCCL) 的依赖进一步阻碍了性能,尤其是在大规模应用中。 虽然 MI300X 提供了更低的总体拥有成本,但目前的性能差距抵消了这一优势。SemiAnalysis 建议 AMD 优先投资于软件开发、测试和工程师资源——包括增加对内部开发硬件的访问——以真正挑战 Nvidia 的主导地位。潜力是存在的,但要实现 MI300X 的承诺,仍有大量工作要做。

对不起。

体验人工智能的真实声音,使用这款交互式音频生成器。 启动! 服务器:10,000 | | | 1,000,000 GPU 负载:0% | | | 100% 燃气涡轮发电机:1 2 3 人员配置:低 中 高 冷却:0% | | | 100% 扩展:钻,宝贝,钻! 用电量 温度 意识 热警告 本地水耗 隔离泄露

对不起。

本文探讨了“解析而非验证”的概念——利用语言的类型系统在解析过程中确保数据的有效性,从而无需后续单独的验证步骤。作者受到Alexis King的工作启发,通过在C++中构建一个日期解析器来演示这一原理,并随着不同的语言标准(C++98、C++11、C++17和C++23)进行演变。 核心思想是创建仅接受有效数据的类型。早期版本(C++98)通过仔细的解析和私有构造函数来实现这一点。 后期版本利用标准库特性:C++11中的`std::get_time`、C++17中的`std::optional`以及C++23中的`std::expected`,来显式处理解析失败的情况。 作者指出,虽然现代特性提供了更简洁的解决方案,但基本原理保持一致:类型本身保证了数据的完整性。他们还强调了LLM在一致应用这些最佳实践方面的当前局限性,通常需要大量的人工干预才能生成健壮的、自验证的代码。作者建议后续可以探讨实际应用以及使用这种方法清理现有的代码库。

## C++中:解析而非验证 摘要 一篇Hacker News讨论围绕“解析,而非验证”的原则——利用语言的类型系统来确保数据的有效性,而不是依赖于代码中显式的验证检查。文章通过不同的C++日期解析器实现来探讨这个概念。 对话强调,格式错误的数据不应被视为异常情况,而应被视为由解析器本身处理的一等公民。现代C++特性,如`std::expected`(在最新编译器中可用)和带有静态工厂的私有构造函数,被认为是创建固有表示有效数据的类型的有利选择。 关键点包括对C++中最佳方法的争论(C++98出人意料地高效),`std::scan`作为`std::print`对应物的潜力,以及这种模式在函数式编程与面向对象编程中是否更自然。最终目标是利用类型系统来*证明*有效性,防止无效数据存在于应用程序中。

此 GitHub 页面详细说明了一个新的问题 (#1213),涉及“Prompt API”提案。该问题由用户 @saschanaz 于 2025 年 4 月 28 日提出。 该提案旨在定义一个新的 Web API,用于与提示进行交互,其说明可在链接的 GitHub 仓库 ([https://github.com/webmachinelearning/prompt-api/blob/main/README.md](https://github.com/webmachinelearning/prompt-api/blob/main/README.md)) 中找到。@domenic 列为提案作者。 目前,该问题缺少 MDN 或 Caniuse.com 的 URL、Bugzilla 链接,以及已识别的 Mozilla 贡献者。Blink 已经发布了该 API 的原型意向。该问题目前在“standards-positions review”项目中状态为“Unscreened”,并带有“negative”标签。目前还没有相关的分支或 pull request。

## Kraftwerk 与 Pelham:25 年版权战落幕 电子音乐先驱 Kraftwerk 与制作人 Moses Pelham 之间持续数十年的版权纠纷,最终在欧洲法院(ECJ)的裁决中落下帷幕。这场案件源于 Pelham 在 1997 年在其制作的 Sabrina Setlur 的歌曲中使用了 Kraftwerk 1977 年歌曲“Metall auf Metal”中的一段两秒循环。 最初倾向于 Kraftwerk,案件在德国法院和 ECJ 之间多次往返。一个关键障碍是德国版权法缺乏“合理使用”的等效规定,阻碍了关于采样行为的明确指导。ECJ 最初站在 Kraftwerk 一方,随后澄清不可识别的采样不构成侵权。 最终,ECJ 裁定 Pelham 胜诉,理由是 2021 年欧盟版权法中引入的“模仿”例外。这允许使用现有作品来创造一种新的、可识别的风格。虽然 Pelham 输掉了关于 2021 年之前使用的索赔,但该裁决在欧盟范围内为模仿形式的采样确立了先例。 这场案件的持续时间——近 30 年——凸显了欧洲法律体系的复杂性以及数字时代版权法的不断演变。尽管这是一场代价高昂且旷日持久的战斗,但这项决定为欧洲的音乐家和版权所有者提供了关于采样实践的急需的清晰度。

一个黑客新闻的讨论围绕着一场持续25年的关于2秒鼓点采样权的法律纠纷。评论员指出,其中的讽刺之处在于,许多采样——包括可能*用于创建*争议采样的那些——通常未经授权,特别是短促的打击乐音效。 对话强调了即使是简短的采样也容易被原始表演者识别,正如Questlove分享的一个轶事,他即使在未经正式授权的情况下,也能在另一位艺术家的曲目中识别出自己的鼓声。 评论员还将此事与广泛使用的“Amen Break”鼓点采样相提并论,该采样被收录在无数歌曲中,但从未支付过版税。这场旷日持久的纠纷引发了人们对双方真正意图的质疑,暗示这可能已经演变成一个原则或法律先例问题,而非重大的财务利益。关于Amen Break历史的资源也被分享。

启用 JavaScript 和 Cookie 以继续。

对不起。

## 亚伦森当选美国国家科学院 & 量子计算紧迫性 斯科特·亚伦森最近宣布当选美国国家科学院院士,表达了感激之情,尽管过去对这类机构持怀疑态度。他承认这项荣誉,但仍专注于他的持续研究,否认这是职业生涯的“巅峰”。 文章随后转到对量子计算迅速对当前加密方法构成威胁的严峻警告。亚伦森报告说,领先的专家现在预测,能够破解现有密码的容错量子计算机最早可能在2029年问世。他认为,加速这些计算机的开发——特别是通过美国公司——具有讽刺意味的是*最*具伦理意义的做法,可以防止外国情报机构获得潜在优势。 他将这种情况与当前的人工智能竞赛相提并论,质疑其背后的原因,但强调紧迫性。亚伦森利用其作为量子计算领域领先声音的平台,发出了直接呼吁:个人和组织必须立即开始过渡到抗量子加密,以避免未来的漏洞。

对不起。

该实验追踪了一台安全配置服务器上的SSH登录尝试——一台配置了防火墙并*强制*使用密钥认证(不允许密码)的服务器。尽管如此,该服务器在一周内面临近500次的登录尝试,通过Fail2ban的积极IP封锁得以缓解。 尝试的用户名显示出常见模式:“sheep”(可能针对子域名),标准默认值如“admin”、“user”和“test”,以及基于服务器操作系统(“ubuntu”)的猜测。值得注意的是,攻击还针对流行的软件包,如“postgres”、“jenkins”和“mysql”,表明在搜索配置不当的安装。甚至尝试了个人姓名。 结论?应尽可能禁用密码认证。即使对于临时服务,强而独特的密码也至关重要,并且像Fail2ban这样的工具对于主动阻止可疑活动并保护您的服务器免受持续的自动化攻击至关重要。

对不起。

## GenAI 可观测性中 OpenTelemetry 的现实 尽管 OpenTelemetry (OTel) 得到广泛支持,但在 GenAI 应用中实现标准化的遥测数据却出乎意料地复杂。Groundcover 正在构建 AI 可观测性解决方案,他们发现所谓的“标准”往往只是一种建议,在 SDK、编排框架和 LLM 提供商之间存在诸多不一致之处。 他们尝试创建通用的规范化工具,发现其中充满了不同的属性名称、消息格式和提供商特定的怪癖。挑战在于驾驭三个关键维度:工具化 SDK(Traceloop、LangSmith 等)、编排框架(LangGraph、CrewAI 等)以及 LLM 提供商(OpenAI、Anthropic 等)。每种组合都可能产生独特的遥测数据,需要大量的解析工作。 Groundcover 识别出四种主要的传入 span “线格式”,并构建了一个规范化工具来解决不一致性——从识别所用模型的方式多达六种,到 token 数量的命名约定有五种,以及提供商之间不同的 token 计算方法。这种规范化对于准确的成本跟踪和可靠的监控至关重要。 最终,Groundcover 旨在简化 AI 可观测性,使其像传统的基础设施监控一样简单明了,无论开发者选择何种工具。他们证明,真正的统一可见性需要积极应对这些现实世界的 OTel 实现差异。

对不起。

## Monad 教程:历史概述 这是一份精选的资源列表,解释 monad,涵盖从理论基础到实际实现。 20 世纪 90 年代初期的探索,如 Philip Wadler 的论文(1992 年,1992-08),将 monad 引入为一种结构化函数式程序的方法,*无需*类别理论知识。 后续工作(Espinosa,1995 年)侧重于使用 monad 进行指义语义和模块化。 21 世纪初,涌现出大量教程,试图向程序员揭示 monad 的奥秘。 Winstanley(1999 年)和 Norvell(2000 年)提供了实用的 Haskell 重点解释,而 Daumé III(2002 年)和 Newbern(2003 年)提供了更全面的介绍。 一个关键主题出现:解释 monad 证明出乎意料地困难,导致了“monad 教程谬误”(Yorgey,2009 年)—— 认为与细节作斗争对于理解至关重要。 后来的教程探讨了各种语言中的 monad(Perl、Ruby、Lisp、Java – Buchholz,2004 年;Herman,2004 年;Carstens,2010 年),通常使用隐喻(太空服、垃圾箱)来帮助理解。 更近期的努力(Marcus,2016 年;Pathak,2020 年)继续寻求更清晰的解释,通常强调实际应用并避免复杂的数学形式主义。 该列表仍在增长,反映了理解函数式编程中这个强大概念的持久挑战和重要性。

对不起。

更多

联系我们 contact @ memedata.com