M1:迈向可扩展的测试时间计算:基于曼巴推理模型
M1: Towards Scalable Test-Time Compute with Mamba Reasoning Models

原始链接: https://arxiv.org/abs/2504.10449

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。与arXivLabs合作的个人和组织都已接受并认可我们开放、社区、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与坚持这些价值观的合作伙伴合作。有提升arXiv社区价值的项目想法吗?了解更多关于arXivLabs的信息。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 M1:迈向可扩展测试时计算的Mamba推理模型 (arxiv.org) dpstart01 2小时前 11 分 | 隐藏 | 过去 | 收藏 | 1 评论 ed 21分钟前 [–] 研究方向很有趣,但这不是你今天想使用的模型。这篇论文研究了一个基于llama3.2-3b并针对mamba修改的30亿参数模型,并将它与一个15亿参数的r1蒸馏版本进行了比较。 回复 加入我们,参加6月16日至17日在旧金山举办的AI创业学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系我们 搜索:

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com