旋转 GPU:在显存受限情况下探索大型混合专家(MoE)模型的本地运行
Rotary GPU: Exploring Local Execution for Large MoE Models Under Limited VRAM

原始链接: https://arxiv.org/abs/2605.29135

arXivLabs 是一个允许合作者直接在我们的网站上开发并分享 arXiv 新功能的框架。与 arXivLabs 合作的个人和组织都认同并接受我们对开放、社区、卓越和用户数据隐私的重视。arXiv 致力于秉持这些价值观,且仅与遵守这些价值观的合作伙伴开展合作。您是否有为 arXiv 社区增值的项目想法?了解更多关于 arXivLabs 的信息。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Rotary GPU:在有限显存下探索大型混合专家模型(MoE)的本地执行 (arxiv.org) 9 分,由 dryarzeg 于 3 小时前发布 | 隐藏 | 过往 | 收藏 | 讨论 帮助 | 指导原则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:
相关文章

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com