## 386芯片的漫长复制之路:AMD与Intel的竞争
关于AMD复制Intel CPU速度慢的说法并不完全准确。虽然AMD的Am386于1991年问世,比Intel的386晚了六年,但延误源于IBM最初对386的不感兴趣——IBM不希望出现与利润丰厚的迷你计算机竞争的芯片,因此没有促使Intel广泛授权。这使得Intel得以避免延长与AMD的许可协议。
AMD花了两年时间逆向工程386,但随之而来的是与Intel长达八年的代价高昂的法律斗争,最终两家公司损失了1亿美元。Intel积极努力延缓AMD的进入,有效地使AMD落后一个世代超过十年,并巩固了其在高利润CPU市场的统治地位。
尽管如此,Am386是一款具有竞争力的芯片,以更低的价格提供与Intel相当的性能,吸引了注重性价比的用户。虽然最终被486和Windows 95的崛起所取代,但Am386展示了AMD的能力,并为其未来奠定了基础,甚至在其PC鼎盛时期之后,在嵌入式系统中存活了多年。这场冲突凸显了Intel的激进策略,并塑造了AMD在CPU领域的轨迹。
## 逆向工程苹果神经引擎:摘要(第一部分)
本系列详细介绍了一位人类研究员(maderix)和AI Claude Opus 4.6合作逆向工程苹果神经引擎(ANE)的过程——这是M4芯片上一个专门的机器学习加速器。苹果有意模糊对ANE的访问,迫使开发者使用抽象的CoreML框架。
该团队成功绕过了CoreML,将软件堆栈映射到内核驱动程序,破解了二进制格式,并实现了对ANE的直接访问。他们发现ANE不是传统的GPU或CPU,而是一个图执行引擎,针对运行编译后的神经网络图作为单个操作进行了优化。
主要发现包括16核设计,深度队列(127个请求),独立的电源管理,以及用于程序编译成高效E5二进制文件的独特机器学习中间语言(MIL)。这些二进制文件参数化了固定的计算基元,如卷积和矩阵乘法,而不是编码算法本身。
该团队的代码可在GitHub上获取,它解锁了直接ANE编程的潜力,并为未来在该先前专注于推理的硬件上进行基准测试(第二部分)甚至训练(第三部分)奠定了基础。