人工智能正在编写自己的内核,速度提高了17倍。
Autocomp: An ADRS Framework for Optimizing Tensor Accelerator Code

原始链接: https://adrs-ucb.notion.site/autocomp

必须启用 JavaScript 才能使用 Notion。请启用 JavaScript 以继续。

## AI驱动的内核优化:黑客新闻讨论总结 黑客新闻的讨论围绕使用人工智能,特别是编码代理,来优化软件内核的可能性——重点是性能提升。最初的想法是利用人工智能进行迭代优化,并在每次更改后运行测试以确保功能和速度。 几个要点浮出水面:对难以复现的特定基础设施优化问题的担忧,硬件多样性在缓解这个问题中的作用,以及人工智能是*辅助*内核编写,而非自主创建的修正。一家初创公司过去尝试解决这个问题的情况被提及,突出了时机的重要性。 对话还涉及Modular的Mojo和AMD的HIP/ZLUDA等项目,探讨了跨厂商GPU内核翻译的潜力。虽然有些人认为“光束搜索”仅仅是超级优化,但另一些人认为,鉴于人类优化张量内核的困难,它仍然很有价值。一篇研究论文([https://arxiv.org/abs/2505.18574](https://arxiv.org/abs/2505.18574))展示了17倍的速度提升,这引发了争论,一位作者澄清这是一种不同寻常的优化。最终,讨论强调了通过降低不同硬件优化代码的门槛,挑战NVIDIA CUDA主导地位的潜力。
相关文章

原文
联系我们 contact @ memedata.com