我尝试了 Karpathy 的 Autoresearch，用在了一个旧的研究项目上。

我尝试了 Karpathy 的 Autoresearch，用在了一个旧的研究项目上。
Autoresearch on an old research idea

原始链接: https://ykumar.me/blog/eclip-autoresearch/

启用 JavaScript 和 Cookie 以继续。

## 自动研究总结这次Hacker News讨论围绕ykumards的“自动研究”实验——使用LLM代理（Claude Code）自主改进机器学习模型。核心思想是循环改进代码、运行训练、评估结果和记录进展。虽然该代理成功识别并修复了一个bug并优化了超参数，但评论员们争论其新颖性和成本效益。许多人指出现有的AutoML框架，如Optuna和贝叶斯优化技术，可以实现类似的结果。然而，潜力在于代理能够持续运行实验，即使无人值守，并可能探索超越简单超参数调整的架构变化。关键要点包括：强大的评估指标的重要性、实验的高成本（尤其是在云基础设施上）以及LLM代理在真正*创新*研究与优化方面的当前局限性。许多人认为自动化繁琐的任务（如bug修复和超参数搜索）具有价值，从而解放人类研究人员进行更高层次的思考。讨论还强调了将这种方法应用于其他软件项目的潜力。

我尝试了 Karpathy 的 Autoresearch，用在了一个旧的研究项目上。 Autoresearch on an old research idea

我尝试了 Karpathy 的 Autoresearch，用在了一个旧的研究项目上。
Autoresearch on an old research idea