## 速度与进展:摘要 作者认为,持续低估速度是良好工作的主要阻碍。虽然质量需要时间,但*慢*并不等同于*好*。事实上,更快的迭代通常会带来更好的结果——一篇更快的博士论文通常更优秀。 快速行动并非急于完成,而是为了最大化脑力并高效学习。速度有助于避免在无关紧要的功能上浪费精力(例如制作没人想听的播客),并通过更快的错误反馈来加速学习。 此外,缓慢的工作会过时。作者以一位教授固守旧讲义为例,说明了重建意愿不足如何阻碍进步。正如经验丰富的外科医生受益于大量的经验一样,快速迭代和频繁练习是改进的关键。核心信息:优先考虑速度,从失败中学习,避免陷入过时的工作。停止缓慢——行动起来!
## Google 的张量处理单元:摘要
Google 的张量处理单元 (TPU) 起源于 2013 年扩展神经网络的需求,面临传统硬件扩展的限制(摩尔定律)。与 GPU 不同,TPU 是*专门*为深度学习设计的,优先考虑矩阵乘法——神经网络运算的核心——而非通用计算。
早期的 TPU (v1-v3) 专注于推理,然后通过 BrainFloat16 等创新技术扩展到训练,以实现高效的精度,并采用收缩阵列架构来最大化算术强度。 后续版本 (v4 及更高版本) 解决了系统级扩展问题,引入了共享 CMEM 以加快数据访问速度、SparseCores 以处理大量嵌入的模型,以及复杂的 optical interconnect (OCS) 以实现大规模、动态可配置的 pod。
TPU 成功的关键在于*协同设计*——将硬件与专用软件(XLA 编译器)和网络紧密集成。这使得确定性执行、高利用率和高效的资源管理成为可能。 近期的进步强调了通过能源效率和系统级优化来降低总体拥有成本 (TCO)。
TPU 不仅仅是更快的芯片;它是一个完整的生态系统。 复制硬件具有挑战性,但 TPU 的故事强调了在不断发展的 AI 加速领域中,专业化、系统思维和持续迭代的重要性。
## Divine D. Rev. 1.1:改进总结
Divine D. 的 Rev. 1.1 是构建稳定、社区驱动的开放移动系统的重要一步,融合了对 Rev. 1.0 评估的反馈。主要变化包括废弃 SecondPCB,其功能已集成到 mainPCB 中。
主要新增功能集中在连接性和功能性方面。**microSD Express** 接口 (PCIe 2.0 Gen 2 x1) 大幅提升存储速度,同时提供支持高达 8K 分辨率的 **Micro HDMI** 输出。**LoRa** 收发器支持用于物联网和网状网络的远距离、低功耗通信。
电源管理方面得到了增强,新增**负载和电池电源开关**以提高效率,以及新的**欠压电池监控器**,防止深度放电电池导致启动循环。**触觉引擎**增加了触觉反馈,新的 **LED 指示灯**提供系统状态更新。
进一步的改进包括**电池断开开关**、扩展的**配件 pogo 接口** (UART, USB, SPI, JTAG) 以及切换到更紧凑的 **M.2 B-key 连接器**,用于 GSM/4G 模块。大量的**设计修复**解决了 Rev. 1.0 中发现的问题,巩固了 Divine D. 作为灵活的开放硬件平台的地位。
## 格雷格·库珀伯格:早期个人电脑游戏中的一位少年天才的失落遗产
在20世纪80年代初,15岁的格雷格·库珀伯格为IBM PC创作了三款令人印象深刻的街机风格游戏——《伞兵》、《PC人》和《J-Bird》,考虑到当时该平台的局限性,这真是一项了不起的成就。这些游戏以其流畅的游戏体验和技术精良而脱颖而出,甚至超越了一些同时期的游戏。库珀伯格通过直接操作PC的硬件,绕过低效的系统调用并利用巧妙的编程技术来实现这一目标。
尽管在Orion Software公司取得了早期的成功,库珀伯格很快就离开了,16岁进入哈佛大学,最终获得了数学博士学位。他成为加州大学戴维斯分校的教授,离开了游戏开发领域。虽然他曾短暂地用Macintosh小应用程序进行编码,但他的热情却在于其他方面。
库珀伯格的故事凸显了计算机历史上的一个独特时刻——一个少年可以对新兴平台产生重大影响的时代。他将早期的成功归功于父母培养的数学天赋和对编程挑战的真正热情。 尽管他没有继续从事游戏开发事业,但他的作品仍然是对足智多谋的证明,并提醒人们“火花”可以点燃对技术的激情。他认为像Python这样易于使用的工具可以激励新一代人,但遗憾的是,如今有抱负的程序员很难发现机会。
## Wolfram 计算服务:扩展您的计算能力
Wolfram 现已推出 **Wolfram 计算服务**,这是一种简化方法,可大幅扩展 Wolfram 语言的计算能力。过去需要大量基础设施,用户现在可以通过 `RemoteBatchSubmit` 函数轻松地将密集型任务(从简单计算到复杂的科学建模)卸载到强大的远程服务器上。
此服务在 Wolfram Cloud 中自动可用,并且可以在 Wolfram Desktop(版本 14.3)中使用 `RemoteBatchSubmissionEnvironment["WolframBatch"]` 启用。它自动处理依赖关系,并与符号表达式无缝协作,将结果直接返回到您的 Wolfram 环境中。
用户可以选择各种机器配置(从 1 个核心到 192 个核心,以及高达 1536GB 内存),并可以通过时间和信用限制来控制成本。使用 `RemoteBatchMapSubmit` 可以轻松实现并行化,从而实现跨众多核心甚至多台机器的计算。
Wolfram 计算服务代表了 Wolfram 能力长期演进的关键一步,建立在现有的并行化工具和云服务之上。未来的发展包括 **Wolfram HPCKit**,允许组织将他们自己的计算设施连接到该系统。该服务旨在使“超级计算机的强大功能”能够为所有 Wolfram 语言用户所访问。