Home
零对冲(ZeroHedge)
每日HackerNews
Show HN: 83 browser-use trajectories, visualized
原始链接:
https://trails-red.vercel.app/viewer
贾斯汀,AI搜索引擎Phind的创建者,正在开发一款新工具,用于调试和分析复杂的LLM驱动的智能体。他意识到获取用户对智能体性能反馈的难度(尤其是在处理冗长的“轨迹”时),因此他使用浏览器使用智能体数据(由gpt-5提供支持)构建了一个可视化演示。 该工具可在[https://trails-red.vercel.app/viewer](https://trails-red.vercel.app/viewer) 访问,旨在确定智能体*何时*和*为何*失败。贾斯汀设想未来的功能,例如实时查询过去的失败案例,并使用偏好模型来改进数据分析。 他正在寻求对演示的反馈,并特别希望与每天生成大量(10k+)智能体轨迹的开发者建立联系,他们可能会从专门的分析解决方案中受益。该项目源于他在Phind的经验,在那里,由于缺乏用户反馈,识别和修复不良搜索结果被证明具有挑战性。
相关文章
原文
联系我们 contact @ memedata.com