Flash-KMeans:快速且内存高效的精确K-Means
Flash-KMeans: Fast and Memory-Efficient Exact K-Means

原始链接: https://arxiv.org/abs/2603.09229

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

## Flash-KMeans:更快更高效的K-Means聚类 一种名为“Flash-KMeans”的新方法,因其显著的速度和内存改进而备受关注。它最初是为了支持视频生成模型而开发的,旨在使*精确*的K-Means——传统上对于大型数据集而言速度较慢的过程——真正可行。 其核心创新“FlashAssign”和“排序反向更新”优化了距离计算和质心更新阶段,绕过了内存瓶颈。这带来了高达17.9倍的加速,优于cuML和FAISS等库(分别快33倍和200倍以上)。 讨论强调,虽然K-Means++侧重于种子选择,但Flash-KMeans改进了核心算法的内部循环。虽然在标准CPU上的收益可能有限,但加速对于GPU加速工作负载尤其重要。该技术建立在类似于“flash attention”的概念之上,并且可能适用于依赖亲和力矩阵的其他算法。
相关文章

原文

arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website.

Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them.

Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs.

联系我们 contact @ memedata.com