每日HackerNews RSS

## 哈佛图书馆护照:快速游览 2026年4月,哈佛庞大的图书馆系统——按员工数量排名第11,按藏书量排名第22——将通过“图书馆护照”项目进行探索。虽然没有官方奖励,但一位作家踏上了对23个地点的排名游览,并对每个地点进行了古怪的评估。 亮点包括阿诺德植物园园艺图书馆(需要预约,专注于树木)、贝克图书馆(奢华,可能适合社交)以及令人惊讶的舒适植物图书馆。有人戏称考特威图书馆是体验医疗紧急情况的好地方,而恩斯特·迈尔图书馆则因其氛围和动物艺术而受到赞扬。 哈佛法学院图书馆(免费咖啡!)、独特的哈佛地图收藏以及威德纳图书馆——因其美丽、资源甚至可以玩耍的楼梯滑行而加冕为最佳整体图书馆,也脱颖而出。相反,科学工程综合体图书馆因其无菌环境而获得最低评价。这次游览揭示了各种各样的空间,从轻松的神学院图书馆到地下的肯尼迪学院图书馆,每个空间都提供了一种独特的体验,置身于这所拥有387年历史的“知识圣地”之中。

## 他们由肉制成:梗概 特里·比松的短篇故事探讨了两个外星生物发现人类时令人不安的顿悟。经过广泛调查,他们确认了一个令人震惊的真相:人类完全由“肉”构成。尽管拥有技术并发送无线电信号,但这些信号实际上是由这些基于肉体的生命形式创造的*机器*发出的。 这些外星人难以理解一个完全由有机物构成的有感知物种——“会思考的肉”。他们驳斥了基于碳的智慧或隐藏的等离子大脑的理论,并反复确认人类的完全肉质本质。 最终,他们得知人类渴望接触和探索,通过“肉的声音”——本质上是语言和歌唱——进行交流。面对与这种生物互动的怪异前景,这些外星人决定抹去所有关于他们发现的记录,认为接触不可取。他们以此为理由,认为人类有限的太空旅行能力使得广泛接触不太可能,甚至微妙地改变了人类的记忆,以确保他们对这次遭遇一无所知,仅仅成为“肉的梦境”。故事以回归一种更令人满意的智慧——氢核心团——结束,突出了对外星事物的传统偏好。

## 监控网络的扩张:理解 Flock Safety 及其他 Flock Safety 公司提供人工智能车牌识别器(ALPR)和现在无人机,因隐私问题受到越来越多的关注和城市(如俄勒冈州的本德市)的抵制。虽然该公司将其技术宣传为减少犯罪,但其技术允许追踪车辆,并且越来越多地追踪个人——甚至记录车辆颜色、行李架和车内物品等细节。 一个主要担忧是数据共享。尽管 Flock 不直接与联邦机构(如移民局)合作,但地方执法部门经常与他们共享数据,有时甚至绕过授权。公众的强烈反对阻止了与亚马逊安全品牌 Ring 的合作计划,但问题不仅仅在于一家公司。 Flock 向能够追踪人员的无人机扩张引发了更大的担忧。尽管该公司声称数据保留时间有限(30 天)并进行加密,但权力掌握在技术的*使用者*——执法部门——及其问责制手中。滥用案例正在增加,从追踪前任伴侣到调查潜在的堕胎。 越来越多的立法努力旨在限制 ALPR 的使用,强制删除数据,并限制数据共享。然而,随着摩托罗拉等竞争对手进入市场,这个问题比 Flock Safety 更广泛。提高意识、倡导强有力的立法,以及支持美国公民自由联盟(ACLU)和正义研究所等组织,对于应对不断扩张的监控环境至关重要。

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

## MegaTrain:在有限硬件上训练大型LLM 一种新的方法,MegaTrain,允许在*单个*GPU上进行全精度的大型语言模型(LLM)训练,参数超过1000亿。关键是将参数和优化器状态存储在主机(CPU)内存中,将GPU视为瞬态计算引擎,并为每一层流式传输数据进出。 这对于VRAM有限的用户来说尤其令人兴奋,例如RTX 3080(10GB),他们目前由于“内存不足”错误而难以处理超过40-50M参数的模型。用户正在探索互补技术,如LoRA和MoE,以进一步优化性能并利用系统内存。 讨论强调了将能力从模型权重转移到自适应工具的重要性,以及为本地硬件优化工作负载。虽然该技术并非全新,但该论文展示了显著的进展——在3090上实现了每秒341个token,但对于完全预训练来说仍然较慢。 此外,还提到了高内存GPU(如H200)的可用性,但成本仍然是一个障碍。最终,重点转向使LLM训练更易于访问和更高效,即使是在消费级硬件上。

## C# 15 引入联合类型 C# 15,可在 .NET 11 预览版 2 中使用,引入了**联合类型**——一项长期请求的功能,提供了一种强大的方式来表示一个值,该值可以是几种不同类型中的一种。与之前使用 `object` 或继承的方法不同,联合类型在编译时强制执行**封闭的类型集合**,保证了**穷尽的模式匹配**,而无需默认情况。 联合类型使用 `union` 关键字声明,列出其可能的案例类型(例如,`public union Pet(Cat, Dog, Bird);`)。编译器处理案例类型与联合类型之间的转换。至关重要的是,联合类型能够实现传统层次结构无法实现的设计,将不相关的类型(如 `string` 和 `Exception`)组合起来。 除了基本语法之外,联合类型还支持诸如在联合类型主体内添加辅助方法(例如,`OneOrMore<T>` 的 `AsEnumerable()`)以及通过 `[System.Runtime.CompilerServices.Union]` 属性与现有的类似联合类型的库兼容等功能。 此功能与封闭层次结构和枚举的提案一起,旨在为 C# 提供一个全面的穷尽性方案。联合类型目前处于预览阶段,鼓励提供反馈以塑造其最终实现。

## 埃兰迪尔欢迎马里奥·泽克纳和 Pi 埃兰迪尔很高兴宣布,编码代理“Pi”的创建者马里奥·泽克纳将加入团队。这一举措源于对软件和人工智能未来为期一年的深入思考,认识到在开发中,*质量*比单纯的速度更重要。 作者在2025年进行了广泛的实验后,认为重点应该放在构建周到的、人机交互上,而不仅仅是高效的输出。Pi作为一个优先考虑软件质量、设计和持久价值的项目脱颖而出——与行业争相发布形成了鲜明对比。 埃兰迪尔自己的项目Lefos也秉持着这种理念,旨在创造能够促进更谨慎的沟通和愉悦体验的人工智能,而不仅仅是提高吞吐量。马里奥对这些原则的承诺使他成为理想人选。 埃兰迪尔打算妥善管理Pi,确保其作为高质量、开源软件持续存在,并探索其与Lefos的协同作用。他们认为,在软件开发中优先考虑关怀和考虑,对于避免未来日益分散注意力和疏离感至关重要。

我们正在验证您是否是真人,而不是恶意自动化程序。 通常,下面的验证码会自动完成。 如果没有自动完成,请点击验证码中的复选框进行验证。 验证通过后,您将被带到您想要访问的页面。 请启用JavaScript和cookies以继续。 如果您在验证完上面的验证码后,不断被重定向到此页面重新验证,请点击下面的按钮联系支持团队。 联系支持 请在您的工单中提及“Ray ID: 9e90f7fc7bdc122f”和“Client IP: 47.245.80.60”。

对不起。

## 从爱好项目到病毒式成功:LED音乐可视化器之旅 2016年,一个简单的项目——制作一个音乐反应式LED灯条——演变成了一项为期十年的追求,最终成为一个广受欢迎的开源项目,在GitHub上获得了超过2,800颗星。 最初尝试基于音量的基本反应,但创作者很快发现仅仅对响度做出反应的局限性。 转向可寻址LED提供了更多的控制,但核心挑战依然存在:**像素贫乏**。 传统的频率分析(FFT)由于LED数量有限而证明无效,需要更深入地了解人类感知。 突破来自于实施**梅尔标度**,它将频率映射到人类*感知*音高的方式,从而极大地提高了可视化器的响应能力。 进一步的改进包括平滑技术(卷积和指数平滑)以及考虑人类视觉的对数响应。 结果是一个具有三个核心可视化的系统,其原理模仿语音识别流程。 尽管取得了成功——被用于夜总会,与Alexa集成,并激发了无数初学者的电子项目——但创作者仍然不满意,旨在创建一个真正*感受*所有流派音乐的可视化器,可能利用人工智能和生物反馈数据。 该项目突出了将音频转换为引人入胜的光显示所涉及的惊人复杂性,证明有效的可视化不仅需要理解信号处理,还需要理解人类感知本身。

对不起。

## Pi 与 Earendil 的未来:摘要 在他的编码代理 pi 受到广泛关注后,开发者马里奥·泽克纳面临一个困境:独自将其商业化,冒着过去在 RoboVM 等开源项目上犯错的风险,还是寻找合作伙伴。他最终加入了由阿明·罗纳赫和科林·安德森创立的 Earendil 公司,与一支才华横溢的团队合作。 泽克纳过去的经验——构建成功的 libGDX 游戏框架以及经历 RoboVM 被 Xamarin/Microsoft 收购的复杂过程——塑造了他避免重蹈覆辙的愿望。他优先考虑保持 pi 的开源精神,并确保在不牺牲家庭生活的前提下实现可持续的未来。 Earendil 提供了一种解决方案:pi 的核心功能采用 MIT 许可,潜在的“公平源码”补充(延迟开源),以及专有的企业功能来资助开发。 GitHub 仓库和包名将转移到 Earendil,但社区 Discord 将保持独立。 泽克纳强调 Earendil 的价值观与他的一致——优先考虑人类利益而非纯粹的商业利益——并相信团队能够负责任地引导 pi 的新篇章,并继续致力于开源原则。

## 使用LLM和Obsidian构建个人知识库 受Andrew Karpathy的工作启发,作者详细介绍了一种长达十年的实践:使用简单文件系统(Obsidian和markdown文件)——而非复杂的向量数据库——作为强大的个人知识库,并利用LLM进行增强。核心思想是超越零散的笔记,创建一个用于*上下文工程*的系统。 与其无休止地为设计文档或项目交接等任务重新收集信息,不如将所有内容——会议记录、Slack对话、文档——集中起来,并使用受PARA启发的文件夹结构(项目、领域、人物、每日/会议)进行组织。Markdown文件中的维基链接创建了一个可导航的互联知识“图谱”。 然后,LLM充当该图谱的自然语言查询引擎。通过向LLM提供相关项目文件夹的访问权限,输出将得到显著改善,因为模型使用*实际*的历史记录,而不仅仅是概括性的回忆。这使得LLM交互从基本的辅助转变为高度知情、感知上下文的工作。 最大的挑战仍然是自动化收件箱处理——有效地分类和整合新信息。然而,即使从小处着手——建立基本的文件夹结构并坚持在会议后做笔记——也能立即获得好处,让工作随着时间的推移而积累。

## 黑客新闻讨论:将文件系统作为图数据库 一场黑客新闻的讨论围绕着将文件系统用作图数据库的想法,尤其是在知识管理和LLM应用方面。核心论点是,一个结构良好的文件系统,通过文件之间的链接,可以作为LLM驱动的知识库的基础。 然而,对话很快深入到实际考虑中。用户们争论这种方法是否在规模上优于向量数据库,并强调高效查询的重要性。 许多评论者分享了他们使用RAG(检索增强生成)的经验,并发现简单的网络搜索通常比当前的RAG实现产生更好的结果。 一个重要的讨论线索集中在使用LLM进行知识检索时的数据隐私挑战。用户们表示不愿与第三方服务共享私人数据,并探索诸如微调本地模型之类的选项,但难以在不损害隐私的情况下生成足够的高质量训练数据。 最终,这场讨论强调了在构建个人知识管理系统时,结构、自动化和隐私之间需要取得平衡,许多人建议采用混合方法,将文件系统组织与LLM驱动的工具结合起来。

更多

联系我们 contact @ memedata.com