我把内核速度提升了 2.2 倍,结果训练循环慢了 3 倍。
I made a kernel 2.2x faster. It made my training loop 3x slower

原始链接: https://kyrieblunders.bearblog.dev/making-dr-grpo-go-brrr/

请启用 JavaScript 和 Cookie 以继续。

Sorry.
相关文章

原文
联系我们 contact @ memedata.com