每日HackerNews RSS

启用 JavaScript 和 Cookie 以继续。

## RHIC 结束 25 年运行,展望与 EIC 的未来 布鲁克海文国家实验室的相对论重离子对撞机 (RHIC) 已完成 25 年的粒子对撞运行,为在同一隧道内建设电子离子对撞机 (EIC) 铺平了道路。 此次关闭引发了前研究人员的回忆和讨论,他们回忆起维持超导温度和最大化束流时间所需的严苛 24/7 运行——成本约为每分钟 1000 美元。 虽然一些人质疑像 RHIC 这样的基础物理研究的实际投资回报,但许多人强调了其重要的科学成就以及对同步辐射光源(用于药物发现和材料科学)、医学成像(PET 扫描)甚至万维网等技术的贡献。 还有人强调了扩展我们对宇宙理解的内在价值。 人们也对布鲁克海文过去的环保措施提出了担忧,包括潜在的放射性物质污染,但一些人反驳说风险已被缓解,并且正在进行监测。 尽管 RHIC 已经结束,但布鲁克海文仍然活跃,斯托尼布鲁克大学将深度参与即将到来的 EIC 项目。

## 编码代理选择:超越排行榜 “哪个编码代理最好?”这个问题具有误导性。性能因语言、任务甚至时间而异,使得单一的“最佳”选择不可靠。与其*预测*最佳代理,更有效的方法是*从*候选池中*选择*——一种“最佳N选一”策略。 这包括并行运行多个代理,每个代理处理相同的任务,并由人工审核员选择最佳实现。这个过程不仅能提供更高质量的代码,还能基于实际合并生成有价值的评估数据。 对18个代理在211个任务上的分析揭示了性能等级,顶级代理与其余代理之间存在明显差距。然而,即使在顶级等级中,排名也存在噪声且置信区间重叠。运行一个群体可以显著提高胜率:顶级代理单独成功率为24%,而三个代理的组合提高到51%,七个代理的组合提高到91%。 关键在于,运行一小群表现最佳的代理——优先考虑前几个——可以大大提高成功几率,超过了额外token的成本,并减少了昂贵的人工工程时间。

## LLM 选择而非预测 一则黑客新闻的讨论集中在使用*多个*大型语言模型 (LLM) 并行处理,并非为了寻找*最佳*解决方案,而是为了增加获得*足够*解决方案的可能性。核心论点挑战了“预测”最佳模型的观念,转而提出一种“选择”策略——扩大潜在解决方案的范围。 用户们讨论说这种方法类似于进化过程,增加了找到合适解决方案的机会。虽然直接将 token 成本增加 7 倍对于许多人来说是不切实际的,但将任务委托给专门的“子代理”等策略提供了一种更高效的替代方案。 对话强调了多个视角的价值,尤其是在解决模糊问题(如领域分解或流程协调)时。一些用户也提出了关于成本和比较来自众多模型的输出的实际问题,建议进行迭代改进,并随着时间的推移淘汰效果较差的代理。最终,讨论指向了对 LLM 使用方式的思维转变——从寻求单个完美答案到利用多样性获得可靠的结果。

请启用 JavaScript 并禁用任何广告拦截器。

## 美国失业与政治辩论 一篇《福布斯》文章报道了自大衰退以来最快的1月份失业率增长,在Hacker News上引发了热烈讨论。最初的帖子引发了对失业原因的争论,迅速演变成政治辩论。 许多评论员指出历史数据表明,民主党政府领导下的就业增长明显高于共和党政府,一些人指出自1989年以来,这一比例为50:1。反驳意见集中在经济政策的时间滞后以及外国战争和金融放松管制可能产生的负面影响上。 对话扩展到更广泛的经济问题,包括二战后劳动力短缺的影响、人工智能的作用以及潜在的垄断行为对工资的压制。一些人对经济数据的准确性和政治议程的影响表示怀疑。科技、交通和医疗保健等行业的具体裁员,以及外包和H1B签证问题也得到了讨论。 最终,该帖子凸显了在解读经济趋势和追究失业责任方面存在深刻的分歧。

## Claude 快速模式:摘要 Claude 现在为 Opus 4.6 模型提供“快速模式”,优先考虑速度而非成本。它不是新模型,而是不同的 API 配置,提供更快的响应——保持与标准 Opus 4.6 相同质量和功能。 使用 Claude Code CLI 或 VS Code 扩展中的 `/fast` 激活它。定价从 150M tokens 的 30 美元起,在 2 月 16 日之前可享受 50% 的折扣。快速模式使用额外的使用量,不包含在标准订阅限制中(Pro/Max/Team/Enterprise 计划)。 **关键信息:** * **成本:** 每 token 的定价明显更高。在对话中途启用比从快速模式开始更昂贵。 * **使用时机:** 适用于交互式任务,例如快速编码迭代和实时调试。 * **不可用:** 在第三方云提供商(Bedrock、Vertex AI、Azure)上。 * **速率限制:** 快速模式有单独的速率限制;超出限制将恢复到标准 Opus 4.6。 目前处于研究预览阶段,功能和定价可能会发生变化。

## Claude 新的“快速模式”与定价争议 Anthropic 发布了 Claude 的“快速模式”,承诺速度提升 2.5 倍,但代价是标准 API 定价的 6 倍。此举在 Hacker News 上引发了激烈的讨论,用户们质疑其价值和潜在影响。 许多人认为,速度提升是通过优先处理请求实现的,本质上是跳过队列,而非根本性的性能改进。人们担心这可能会降低标准服务的速度,对那些不愿支付额外费用的人造成影响。一些人推测 Anthropic 正在试探进一步提高价格和潜在“服务恶化”的可能性。 用户们强调了高昂的成本——很快就会消耗完额度——并将其与 Gemini 等替代方案进行对比,后者以更低的价格提供速度提升。同时,也有需求希望提供一个*更慢*、更便宜的模式,用于非紧急任务。 讨论涉及了底层基础设施,理论从 TPU 到优化的队列管理等多种猜测。最终,共识倾向于这是一种针对时间紧迫且财力充裕的用户的高级服务,可能会牺牲其他用户的可负担性。

这篇短文反思了随着强大人工智能编码工具的出现,软件开发领域正在迅速变化。作者哀叹传统的编程技艺——解决问题的能力、创造性的所有权以及通过手动编码获得的深刻理解。 虽然承认人工智能的有效性及其不可避免的采用,但作者着重关注了它给经验丰富的程序员带来的困境。为了保持竞争力,他们感到被迫使用这些工具,尽管为此失去了自己的技能感到惋惜。 核心信息是对一种正在消逝的艺术形式的悲伤。作者预测未来手动编码将成为过去时代的遗物,并邀请其他资深开发者一同哀悼他们毕生致力于的技艺的逝去,即使他们也在适应以求生存。 这既是对进步的认可,又带有一种深刻的失落感。

内森·兰伯特(Nathan Lambert)的著作《从人类反馈中进行强化学习》(RLHF)是一个持续进行的项目,2025年全年及2026年初都有重大更新。该书最初于2025年4月完成(v0),之后根据编辑反馈进行了大量修改,截至2026年1月,其结构已进行重大重组,模仿了Manning书籍的结构。 主要新增内容包括关于工具使用和直接偏好优化(DPO)的章节,以及对推理、策略梯度和近端策略优化(PPO)相关部分的改进。本书还讨论了RLHF在产品开发中的应用,并融入了最新的研究成果。 兰伯特感谢了Costa Huang和Claude等人的贡献,以及更广泛的研究人员和GitHub贡献者。本书目前可在[https://rlhfbook.com](https://rlhfbook.com)在线阅读,引用方式为Lambert, 2025。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交 登录 从人类反馈中进行强化学习 (rlhfbook.com) 114 分,by onurkanbkrc 14 小时前 | 隐藏 | 过去 | 收藏 | 5 评论 https://arxiv.org/abs/2504.12501 dang 8 小时前 | 下一个 [–] 相关。还有其他? RLHF 书籍 - https://news.ycombinator.com/item?id=42902936 - 2025年2月 (37 评论) 回复 verdverm 12 小时前 | 上一个 | 下一个 [–] 上次我看到 Nathan 提到这本书时,他正在积极地进行下一版本的编写,并寻求反馈,请查看他的社交媒体。 回复 leggerss 10 小时前 | 父级 | 下一个 [–] 你可以说他也在从人类反馈中学习。 回复 klelatti 13 小时前 | 上一个 | 下一个 [–] 带有链接等的网页版本: https://rlhfbook.com/ 回复 dang 8 小时前 | 父级 | 下一个 [–] 谢谢!我们已经从 https://arxiv.org/abs/2504.12501 切换到上面那个,并将后者放在了顶部文本中。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 斯多葛主义:生活的基础 斯多葛主义起源于古希腊,并在罗马得到完善,是一种实用的哲学,专注于应对人生的不确定性。其核心在于探究真正属于我们控制范围内的东西——我们的思想和判断——以及了解这些后我们应该如何生活。其他一切,包括外部事件和别人的行为,都超出了我们直接的影响范围。 斯多葛主义由季提乌姆的芝诺创立,受到犬儒学派哲学家如克拉底的影响,他们提倡简朴和摆脱欲望。斯多葛主义演变成了一条通往内心自由的结构化道路。关键人物如马可·奥勒留(一位哲学家皇帝)、爱比克泰德(一位前奴隶)和塞内卡(一位尼禄的富裕顾问),展示了这种哲学的适应性。 核心信条包括专注于**美德**——智慧、正义、勇气和自律——作为唯一的善,接受我们无法改变的事物(**命运之爱**),并理解情绪是判断而非不可控制的力量。**控制二分法**至关重要:通过关注内在反应并根据**自然**(理性和现实)生活,我们可以培养韧性和平和。 斯多葛主义不是关于压抑感觉,而是通过清晰和接受来掌握它们。它是一套建立性格和过上有意义的生活的工具,无论外部环境如何。这是一个基础概述,未来计划进一步探讨这些概念。

## 斯多葛学派:黑客新闻讨论摘要 黑客新闻上的一条帖子讨论了斯多葛学派哲学,起因是对stoacentral.com的链接。虽然它通常与罗马人物如塞内卡和马可·奥勒留联系在一起,但评论员指出它的起源是希腊,思想家克莱安提斯和克吕西波斯是奠基人。 讨论强调,斯多葛学派不仅仅是关于压抑情绪,而是关于关注美德和接受你无法控制的事情。然而,有些人发现斯多葛学派最初的“物理学”具有挑战性,更喜欢伊壁鸠鲁学派等替代哲学。 几位用户推荐了学习资源,包括Rymke Wiersma的《如何成为一名斯多葛主义者》和《斯多葛笔记》。一个关键的收获是,现代解读通常强调自助方面,有时以牺牲该哲学更复杂、唯物主义的根源为代价。一位评论员注意到,将斯多葛学派误解为冷酷无情的借口是一种令人担忧的趋势。最终,斯多葛学派被呈现为一种永恒的哲学,以勇气、智慧、节制和正义为中心。

## 布加勒斯特的小小胜利:教堂 由建筑师斯特凡·帕瓦卢塔领导的Vinklu,将布加勒斯特一个难以置信的狭窄地块改造成了“教堂”,这是一家引人注目的咖啡店,展示了在极端限制下的创新设计。这个463平方英尺的空间升起为一个戏剧性的三角棱镜,最大化了之前无法使用的地块。 “教堂”几乎完全覆盖着三层玻璃,像一个充满光明的灯塔,折射日光并在夜间发光。异地预制最大限度地减少了浪费和干扰,轻型钢框架支撑着透明的外立面。巧妙地,设计*融入*了一棵成熟的树木,增强了建筑与自然的联系。 内部,浅色木材营造出一种温暖、诱人的氛围,由于高耸的屋顶线条,空间感出人意料地宽敞。“教堂”证明了有影响力的建筑并不需要大面积的占地,它提供了一种独特的城市体验,以及对居住狭小空间的新视角。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Vinklu 将布加勒斯特被遗忘的地块改造成小咖啡馆 (design-milk.com) 16 分,surprisetalk 发表于 10 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 软件工厂与代理AI的兴起 StrongDM 公开详细介绍了其“黑暗工厂”软件开发方法——一种AI编码代理在*无需*人工干预的情况下编写、测试和完善代码的系统。这建立在最近的LLM进展之上,例如Claude Opus 4.5和GPT 5.2,它们在可靠地遵循复杂的编码指令方面表现出显著的飞跃。 其核心原则:**不编写或审查人工代码。** 为了确保质量,StrongDM 采用“场景测试”——使用与代理程序分离的详细“用户故事”,并通过“满意度”指标(概率成功率)进行评估。 关键是,他们构建了一个“数字孪生宇宙”——AI克隆的外部服务副本(Okta、Jira、Slack 等),从而实现大规模的、不受限制的测试。 这种方法,得益于“基因输血”(模式提取)和“Semports”(代码移植)等工具,出人意料地具有成本效益。StrongDM 认为,每月至少 1,000 美元的代币支出*每位工程师*表明对 AI 能力的投资充足。他们甚至开源了组件,包括其核心代理程序(“Attractor”)的规范和“AI 上下文存储”(cxdb)。这代表着软件工程的潜在转变,将开发者推向构建和监控*构建*代码的系统。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 StrongDM 的 AI 团队在不看代码的情况下构建了严肃的软件 (simonwillison.net) 41 分,由 simonw 发布 15 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 dang 9 小时前 | 下一个 [–] 相关持续讨论(目前在首页):软件工厂和代理时刻 - https://news.ycombinator.com/item?id=46924426。 编辑:我认为将线程合并并从正文中链接到 simonw 的评论是合理的。 这样我们就可以进行一次讨论,其中包含两种输入(原始帖子和评论)。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Al Lowe:超越休闲装劳瑞 这次对游戏开发者Al Lowe的采访揭示了他比他最著名的作品《休闲装劳瑞》更为广阔的职业生涯。虽然他以与Sierra合作开发的标志性系列游戏而闻名,但Lowe的早期作品涵盖了众多游戏,并展现了多样化的技能。他讲述了在Sierra工作的16年,为26款产品做出贡献——从拼写程序到《唐老鸭乐园》,以及他独特的交付完成作品的策略,*在*寻求广泛意见之前。 对话还深入探讨了Lowe游戏开发之外的爱好:对模型火车(目前是N比例)一生的热爱,以及在多个乐队中演奏萨克斯管的奉献精神。他回忆了幽默的轶事,包括在挪威的医疗紧急情况,以及穿越挪威山脉的灾难性火车旅行。 Lowe反思了游戏的发展,哀叹了游戏重心从解谜和深思熟虑的游戏玩法上转移,并分享了他对Sierra最终衰落的见解,包括历史游戏资料的悲惨损失。他还讨论了他独特的设计选择,例如以“你”称呼玩家,以及许多Sierra冒险游戏中臭名昭著、极具挑战性的楼梯。最终,这次采访描绘了一个富有创造力、多才多艺的个体,他对游戏的影响远远超出了一个单一的、具有暗示性的主角。

这个Hacker News讨论围绕着*spillhistorie.no*对《休闲装劳瑞》系列游戏创作者Al Lowe的采访。最初的帖子引起混淆,因为“Al”和当前的科技热词“AI”靠得太近,一位评论员指出需要一种能够更好地区分它们的字体。 对话很快转移到模型火车,显示这个爱好已经变得出人意料地高科技,使用了数字控制系统(DCC),并利用了各种协议,如I2C和MQTT。用户们讨论了改造旧火车、简化布线以及过度自动化可能使爱好变得过于复杂的问题。 几位评论员分享了关于Al Lowe的个人轶事,赞扬了他的友善,并回忆起童年时期玩他游戏的愉快回忆——包括《唐老鸭乐园》。这个帖子突显了人们对Lowe作品的怀旧之情,以及游戏开发与模型铁路世界之间令人惊讶的联系。

更多

联系我们 contact @ memedata.com