PaperBench
PaperBench

原始链接: https://openai.com/index/paperbench

请启用JavaScript和Cookie以继续

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 PaperBench (openai.com) meetpateltech 2小时前 17 分 | 隐藏 | 过去 | 收藏 | 2 条评论 smusamashah 1小时前 | 下一条 [–] 我们在 PaperBench 上评估了几种前沿模型,发现性能最佳的测试代理是带有开源脚手架的 Claude 3.5 Sonnet(新版),其平均复制得分达到 21.0%。 回复 DrillShopper 7分钟前 | 上一条 [–] PaperBench 听起来像是针对最近发布的 GPU 的基准测试软件包。 回复 加入我们 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:
相关文章

原文
联系我们 contact @ memedata.com