研究:自主生成的智能体技能无用
Study: Self-generated Agent Skills are useless

原始链接: https://arxiv.org/abs/2602.12670

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

## LLM 代理与“自生成技能” - 摘要 近期一项研究(arxiv.org)表明,仅仅让 LLM *生成* “技能”——本质上是写下程序性知识——并不能提高性能。核心问题在于 LLM 已经拥有这些潜在知识,因此重复这些知识并不能增加价值。 讨论的中心在于什么构成有用的“技能”。许多人认为,技能在通过研究、提炼超出 LLM 训练数据的信息,并针对特定工作流程进行定制时,效果最佳。然而,将 LLM 输出逐层叠加会导致性能下降,类似于反复压缩文件或玩“传话游戏”。 一个关键点是反馈循环的重要性。具有指标和自我调整能力的代理比那些在“开环”状态下运行的代理表现更好。此外,人类在完善这些技能方面所起的作用——提供上下文和消除歧义——仍然至关重要,即使 LLM 展现出技能构建的潜力。最终,持续学习和基于适配器的机制被认为比仅仅提示 LLM 定义自己的知识更具前景。
相关文章

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com