该资源由斯坦福大学 DAM 项目的 David Shim 维护,提供了一个可交互、可下载的数据集,用于追踪内存和存储的历史及当前成本。 主要特点包括: * **价格趋势:** 使用对数刻度可视化图表,追踪 DRAM、NAND 闪存和 HBM 的每千兆字节成本($/GB)。 * **细粒度分析:** 按代际细分 DRAM 和 HBM 成本(例如从 DDR3 到 DDR5,从 HBM2e 到 HBM4),并提供人工智能加速器组件(逻辑、封装和辅助成本)的模型估算。 * **方法论:** 该数据集结合了经典的 McCallum 内存价格历史记录与来自亚马逊(通过 Keepa)的实时零售数据。由于没有公开的现货市场,HBM 数据来源于行业分析师的估算。 **注意事项:** 数据反映的是以名义美元计算的最低零售价格,而非合同价或经通胀调整后的数据。由于零售价格往往反映了产品的清仓价格,因此可能与尖端产品的定价存在差异。该项目每月更新一次 DRAM/NAND 数据,每季度更新一次 HBM 数据,旨在为研究人员提供一个透明、不断演进的资源。所有数据均可供下载,并提供完整的来源说明以供引用。
“你以后不会需要它”(YAGNI)常被误解为一种节省精力或降低代码生产成本的规则。然而,作者认为 YAGNI 实际上是一项由价格理论支配的关于时机的原则。
在真正需要某项功能之前构建投机性结构会产生两个隐形成本:
1. **丧失选择权:** 在掌握完整信息之前就确定结构会束缚你的手脚。即便你的猜测正确,你也失去了灵活调整的机会。如果需求发生变化,你不仅要为构建错误的结构买单,还要额外支付将其拆除的成本。
2. **净现值(NPV)低下:** 在必要之前产生成本,会通过加速支出和延迟潜在收益,对净现值产生负面影响。
AI 生成代码的兴起使这一原则变得更加重要,而非过时。尽管 AI 可以“免费”编写代码,但投机性结构带来的成本——即灵活性降低和现金流低效——依然存在。归根结底,YAGNI 关乎的并非打字成本,而是如何保留选择权并管理投资时机。你应当只在需要时进行构建,因为保留选择权和资本的价值,远高于过早准备所带来的价值。
在这场主题演讲中,机器学习工程师 Vicki 探讨了在生成式 AI 时代,行业对传统机器学习角色产生的“存在主义焦虑”。她以荷兰黄金时代画家雷切尔·鲁伊斯(Rachel Ruysch)为例——鲁伊斯通过数十年的刻意练习和细致观察达到了艺术巅峰——以此论证技术卓越性依然至关重要。
为了探索这一观点,她构建了 Rijksearch,这是一个针对荷兰国立博物馆藏品的语义搜索引擎。她记录了自己的“创新代币”之旅:刻意选择学习一门新语言(Go)、利用向量集,并尝试多模态嵌入技术。
Vicki 强调了一个关键区别:AI 是处理“粘合工作”、数据格式化和加速学习的绝佳工具,但它无法取代人类的“数据感”或架构直觉。她警告称,过度依赖大语言模型生成代码会导致认知卸载,使工程师失去理解或维护自身系统的能力。
最后,她总结道:虽然 AI 可以加快执行速度,但掌握技术没有捷径。构建优秀的系统是一种需要时间、导师指导以及与数据建立深层实际联系的工艺——本质上,就是学会“画出我们自己的花朵”。
A. Sina Booeshaghi 批判性地审视了“QED 分数”(QED score)。这是一种由 QED Science 开发、旨在对科学论文质量进行排名的 AI 生成指标。尽管该工具利用大语言模型提供快速反馈,但作者指出,其核心主张——即它能提供比传统指标更准确、更少偏见的科学质量衡量标准——缺乏证据支持。
Booeshaghi 指出了该白皮书中三项验证案例研究的重大缺陷:它们缺乏方法论的透明度,存在内部不一致性,并依赖于不受控制的变量。此外,对 QED“前 1%”排名的公开分析揭示了令人担忧的地理偏见,系统性地低估了来自非洲和南美洲研究机构的成果。
归根结底,作者认为将复杂的科学研究压缩为单一的数字分数是还原主义的,且具有危险性。虽然人工智能在索引和提供反馈方面具有潜力,但 QED 分数缺乏此类高风险指标所需的严谨、独立的验证。评论最后带有一丝讽刺意味:按照该系统声称要执行的标准,QED 白皮书本身就不符合“质量”的标准。