MHC:多流形约束超连接
MHC: Manifold-Constrained Hyper-Connections

原始链接: https://arxiv.org/abs/2512.24880

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都拥抱并接受了我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与坚持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 MHC:流形约束超连接 (arxiv.org) 7点 由 ipnon 3小时前 | 隐藏 | 过去 | 收藏 | 1评论 Alifatisk 35分钟前 [–] 所以如果我理解正确,直到今天为止所有的Transformer都具有相同的残差设计,单流承载层间信息。DeepSeek想出了如何在不导致训练崩溃的情况下加宽它。哇,Deepseek做得太棒了!回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:
相关文章

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com