只要 Grep 就够了吗?智能体检索(Agentic Search)如何重塑代理工具的应用
Is Grep All You Need? How Agent Harnesses Reshape Agentic Search

原始链接: https://arxiv.org/abs/2605.15184

arXivLabs 是一个允许合作者直接在我们的网站上开发和共享 arXiv 新功能的框架。与 arXivLabs 合作的个人和组织都认同并接受我们关于开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于践行这些价值观,并仅与坚持这些价值观的合作伙伴合作。如果您有能为 arXiv 社区创造价值的项目构想,请了解更多关于 arXivLabs 的信息。

关于论文《仅仅使用 Grep 就够了吗?》(*Is Grep All You Need?*)的 Hacker News 讨论揭示了一场关于在智能体工作流中,简单的字符串匹配与语义搜索孰轻孰重的细致辩论。 批评者认为该论文的标题具有标题党嫌疑,并指出该研究依赖于一个偏向字面检索的基准测试(LongMemEval),这自然对 `grep` 更为有利。另一些人则强调,虽然 `grep` 出奇地有效(部分原因是开发者被“社会工程化”地训练去编写整洁、易于搜索的代码),但它缺乏 LSP、tree-sitter 或向量数据库等语义工具的深度。 社区的主要观点包括: * **工具上下文至关重要:** 在编程相关的智能体中,`grep` 的表现往往优于语义搜索,因为模型在 `grep` 上经过了大量训练,而语义搜索则需要更复杂、往往不一致的引导。 * **混合方案是赢家:** 许多用户提倡一种“博采众长”的方法,即将用于精确匹配的 `grep` 与用于概念检索的混合搜索(BM25 + 向量)相结合。 * **“Grep”偏见:** 大语言模型在强化学习的驱动下表现出对 `grep` 的强烈偏好,有时如果不特别指示,它们会忽略更高级的工具。 归根结底,共识是:`grep` 在特定任务中是一个强大的工具,但对于构建健壮的智能体系统而言,它几乎不可能是“你所需要的全部”。
相关文章

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com