将人工智能代理与现实世界渗透测试中的网络安全专业人员进行比较

将人工智能代理与现实世界渗透测试中的网络安全专业人员进行比较
Comparing AI agents to cybersecurity professionals in real-world pen testing

arXivLabs是一个框架，允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都接受并拥护我们的开放、社群、卓越和用户数据隐私等价值观。arXiv致力于这些价值观，并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法？了解更多关于arXivLabs的信息。

## AI 与网络安全专家在渗透测试中的对比：摘要一项最新研究（以及相关的《华尔街日报》文章）探讨了人工智能代理，特别是“阿尔忒弥斯”，在执行网络渗透测试——一项核心网络安全任务——方面的能力。研究结果表明，人工智能正迅速在该领域发展，可能颠覆传统角色。虽然尚未完美，但“阿尔忒弥斯”的成果可与人工渗透测试人员相媲美，并且成本仅为人工渗透测试人员的零星一部分。专家预测，人工智能将在自动化“常规”任务（如网络、Web 和代码审查）方面表现出色，可能在 1-2 年内处理 80-90% 的漏洞发现。然而，复杂、新颖的漏洞发现和业务逻辑缺陷对人工智能来说仍然具有挑战性。讨论强调，当前人工智能的优势在于高效处理信息和识别供人工调查的“信号”。大型语言模型 (LLM) 正在证明其在解释复杂代码和加速研究方面的价值。然而，人们仍然担心误报以及需要人工监督。最终，共识倾向于人工智能在短期内*增强*而非*取代*人类安全专业人员。其影响可能是一次技能需求的变化，以及对传统服务预算的潜在颠覆，重点将放在更高层次的分析和漏洞利用开发上。

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

将人工智能代理与现实世界渗透测试中的网络安全专业人员进行比较 Comparing AI agents to cybersecurity professionals in real-world pen testing

将人工智能代理与现实世界渗透测试中的网络安全专业人员进行比较
Comparing AI agents to cybersecurity professionals in real-world pen testing