## MinIO:从废弃项目到社区复兴
MinIO 是一款流行的开源对象存储服务器,在经历一系列许可变更和功能限制后,于2026年2月被其母公司MinIO Inc. 存档,实际上被放弃。这引发了对开源可持续性的担忧,特别是考虑到MinIO 拥有庞大的用户群(60k星标,10亿次Docker拉取)。
然而,该项目已被社区维护者复兴,他们分叉了仓库(现为 `pgsty/minio`)。这项工作侧重于恢复MinIO Inc. 移除的关键功能,包括管理控制台,并重建用于Docker、RPM 和 DEB 包的稳定二进制分发流水线。
该维护者强调供应链的连续性以及漏洞/CVE 修复,而非新功能。该分叉利用了MinIO Inc. 最初选择的AGPLv3 许可,以确保社区维护和分发软件的权利。虽然存在商标方面的考虑,但该项目旨在提供可靠的、可用于生产的MinIO 替代方案,并借助现代AI编码工具来高效管理维护。核心信息是:开源代码一旦发布,即使原始公司放弃,也能持续存在。
## 拯救数字历史:抢救软盘数据的斗争
数十年间,软盘是存储和共享数字信息的*主要*方式。现在,数十亿张软盘正在腐朽,随着读取它们的硬件消失,威胁着出现“数字黑暗时代”。剑桥大学图书馆的档案学家莱昂蒂恩·塔尔博姆正领导一项努力,以防止这种损失,从这些老旧的遗物中恢复数据——包括斯蒂芬·霍金之前无法访问的讲座。
挑战是巨大的。软盘有许多不兼容的格式,需要专门的(通常是自制的)工具,例如复古计算爱好者开发的“Greaseweazle”。保存工作包括仔细清洁和“镜像”软盘,以在磁性数据因热、湿度或霉菌而褪色之前捕获它们。
令人惊讶的是,软盘在某些领域仍然存在——美国军方直到2019年才在核系统中使用了它们,而日本最近才逐步淘汰它们用于政府用途。塔尔博姆的作品,记录在指南“Copy That Floppy!”中,强调了协作的重要性,并证明即使是看似过时的技术也可能包含宝贵的历史数据,从研究笔记到早期的数字艺术。一场抢救这个脆弱过去的竞赛正在进行,以免它永远消失。
## SmartKNN:一种增强的最近邻算法
SmartKNN是经典K最近邻(KNN)算法的现代改进版本,旨在提高准确性、鲁棒性和可扩展性。与传统KNN算法平等对待所有特征不同,SmartKNN使用诸如MSE相关性、互信息或随机森林重要性等方法**学习特征重要性**,从而有效抑制不相关的维度。
它利用**自适应邻居搜索**,为处理大型数据集提供暴力搜索和近似最近邻(ANN)选项,并具有潜在的GPU加速能力。SmartKNN支持**回归和分类**任务,采用距离加权投票和自动数据预处理(处理NaN值、归一化等)。
SmartKNN采用与scikit-learn兼容的API并使用NumPy/Numba进行优化,优先考虑实际性能,并保持稳定的API(v2.x系列)。它采用MIT许可证发布,并鼓励研究合作。
人工智能的快速发展很大程度上受到利润驱动,建立在大量抓取的互联网数据之上,可能对就业甚至人类造成灾难性后果。然而,Claude的创造者Anthropic最近因拒绝与美国政府在涉及自主武器或大规模监控的项目中合作而与众不同——这一立场导致他们被禁止政府使用。
这与OpenAI形成了鲜明对比,OpenAI由Sam Altman领导,尽管最初声称不用于监控,但却乐意向美国国防部提供ChatGPT。一位政府官员澄清,OpenAI的技术*将*被用于“所有合法手段”,可能会利用爱国者法案中的漏洞。
Anthropic优先考虑对其技术应用的控制,而Altman似乎愿意服从政府的判断。此举引发了OpenAI用户的强烈反弹,许多人取消了订阅。值得注意的是,其他主要的AI参与者——谷歌、微软、亚马逊、Meta和Palantir——很少表现出对军事应用或监控的类似伦理保留。