## 从编译器到硬件:重新发现进位保存加法 这篇博文探讨了编译器优化与硬件设计之间令人惊讶的联系,具体展示了编译器技术——循环融合——如何“重新发现”一种硬件优化,即进位保存加法。 进位保存加法通过使用全加器将三个输入减少到两个来加速多个位向量的加法,无论位向量宽度如何,其操作时间都是恒定的。传统上这是一种硬件解决方案,作者们质疑这是否可以从编译器转换中推导出来。 他们通过将位向量加法转换为具有两个顺序循环的程序来证明这一点,然后应用循环融合。虽然融合后的循环*看起来*相似,但详细的位级证明——涉及在F2中的归纳和操作——证实了它与进位保存方法的等价性。 这并非关于重新发明已知的优化,而是强调了编译器通过利用程序规律性自动发现硬件级改进的潜力。作者们建议这种方法可以解锁进一步的优化,从而弥合传统编译器技术与硬件设计之间的差距。
最近一项“鹈鹕骑自行车”基准测试——一项故意荒谬的大语言模型测试——揭示了一个令人惊讶的结果。来自阿里巴巴的Qwen3.6-35B-A3B表现优于Anthropic的Claude Opus 4.7,甚至生成了一个可用的SVG插图,并添加了一个有趣的细节(火烈鸟戴着太阳镜!)。
创建该基准测试以评论客观比较模型困难的作者指出,这个结果很不寻常。 历史上,更好的“鹈鹕”输出与整体模型实用性相关。 然而,尽管Opus 4.7是一个专有的、可能更强大的模型,但它在完成这项任务时遇到困难,甚至无法准确描绘自行车框架。
这表明该基准测试正在失去与实际效用的联系,突出了使用简单测试评估人工智能能力的固有挑战。 虽然Qwen的成功值得注意,但作者强调这并不一定表明其整体性能更优越,而是擅长*这项特定的、荒谬的任务*。