## 使用人工智能自动化告警分诊 Quickchat 的作者厌倦了每天早上手动筛选 Datadog 告警,因此他们使用 Claude Code 构建了一个自动化系统来处理这项繁琐的任务。由于需要处理跨多个平台的大量日常对话,他们的 Datadog 实例“繁忙”,他们旨在消除将告警分类为真正问题或瞬时问题的每日例行工作。 该解决方案在约 30 分钟内构建完成,利用 Datadog 的模型上下文协议 (MCP) 授予 Claude Code 访问实时监控数据的权限。一个自定义“技能”指示人工智能对告警进行分诊,将其分类为可操作的错误、基础设施问题或噪音。对于可操作的错误,人工智能会启动隔离的工作树,编写带有测试的修复程序,并自动打开拉取请求。一个 cron 作业每天运行此过程。 结果如何?作者现在醒来时会看到预先创建的 PR,大大减少了早上的调查时间,并让他们能够更早地开始专注工作。虽然承认它无法取代重大故障期间的人工干预,但这种“懒惰工程”方法展示了自动化如何叠加改进、保留上下文并简化事件响应。该系统易于实施,并且可以适应其他重复性任务,例如安全扫描和依赖项更新。
人工智能代理正在自动化重复性任务,让人类可以专注于创造力和批判性思维——这是软件开发领域一个令人兴奋的转变。然而,广泛采用取决于**信任**:确保代理可靠地*按预期*执行,并避免意外行为。
Fabraix 正在通过其开源“游乐场”(playground.fabraix.com)建立这种信任。该平台通过挑战社区使用可见的系统提示和工具来“越狱”实时代理,从而压力测试人工智能代理的安全性。
挑战是社区驱动的——由社区提出、投票和计时。成功的漏洞利用会被公开记录,从而促进集体学习并推动人工智能防御的改进。这种迭代的攻防过程建立了对人工智能漏洞的共同理解。
Fabraix 认为,开放、协作的安全测试对于构建强大而可靠的人工智能系统至关重要,最终使所有使用这项技术的人受益。该项目的前端和挑战配置是公开可用的,从而促进透明度和社区贡献。