(评论)
(comments)

原始链接: https://news.ycombinator.com/item?id=43460455

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 每一次失败都重要:在没有高端GPU的情况下扩展300B LLM(arxiv.org) 8 分,由 bretpiatt 1小时前发布 | 隐藏 | 过去 | 收藏 | 1 评论 osti 5 分钟前 [–] 我认为这是他们不用英伟达GPU训练LLM的那个。 回复 加入我们 6月16-17日在旧金山参加AI创业学校! 指导原则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系方式 搜索:

相关文章
  • (评论) 2025-03-26
  • (评论) 2025-03-26
  • (评论) 2025-03-27
  • (评论) 2025-03-25
  • (评论) 2025-03-22

  • 原文
    Hacker News new | past | comments | ask | show | jobs | submit login
    Every Flop Counts: Scaling a 300B LLM Without Premium GPUs (arxiv.org)
    8 points by bretpiatt 1 hour ago | hide | past | favorite | 1 comment










    I think this is the one where they train LLM without NVIDIA GPU's.






    Join us for AI Startup School this June 16-17 in San Francisco!


    Guidelines | FAQ | Lists | API | Security | Legal | Apply to YC | Contact



    Search:
    联系我们 contact @ memedata.com