启用 JavaScript 和 Cookie 以继续。
启用 JavaScript 和 Cookie 以继续。
## 编码代理选择:超越排行榜
“哪个编码代理最好?”这个问题具有误导性。性能因语言、任务甚至时间而异,使得单一的“最佳”选择不可靠。与其*预测*最佳代理,更有效的方法是*从*候选池中*选择*——一种“最佳N选一”策略。
这包括并行运行多个代理,每个代理处理相同的任务,并由人工审核员选择最佳实现。这个过程不仅能提供更高质量的代码,还能基于实际合并生成有价值的评估数据。
对18个代理在211个任务上的分析揭示了性能等级,顶级代理与其余代理之间存在明显差距。然而,即使在顶级等级中,排名也存在噪声且置信区间重叠。运行一个群体可以显著提高胜率:顶级代理单独成功率为24%,而三个代理的组合提高到51%,七个代理的组合提高到91%。
关键在于,运行一小群表现最佳的代理——优先考虑前几个——可以大大提高成功几率,超过了额外token的成本,并减少了昂贵的人工工程时间。
请启用 JavaScript 并禁用任何广告拦截器。
## Claude 快速模式:摘要 Claude 现在为 Opus 4.6 模型提供“快速模式”,优先考虑速度而非成本。它不是新模型,而是不同的 API 配置,提供更快的响应——保持与标准 Opus 4.6 相同质量和功能。 使用 Claude Code CLI 或 VS Code 扩展中的 `/fast` 激活它。定价从 150M tokens 的 30 美元起,在 2 月 16 日之前可享受 50% 的折扣。快速模式使用额外的使用量,不包含在标准订阅限制中(Pro/Max/Team/Enterprise 计划)。 **关键信息:** * **成本:** 每 token 的定价明显更高。在对话中途启用比从快速模式开始更昂贵。 * **使用时机:** 适用于交互式任务,例如快速编码迭代和实时调试。 * **不可用:** 在第三方云提供商(Bedrock、Vertex AI、Azure)上。 * **速率限制:** 快速模式有单独的速率限制;超出限制将恢复到标准 Opus 4.6。 目前处于研究预览阶段,功能和定价可能会发生变化。
这篇短文反思了随着强大人工智能编码工具的出现,软件开发领域正在迅速变化。作者哀叹传统的编程技艺——解决问题的能力、创造性的所有权以及通过手动编码获得的深刻理解。 虽然承认人工智能的有效性及其不可避免的采用,但作者着重关注了它给经验丰富的程序员带来的困境。为了保持竞争力,他们感到被迫使用这些工具,尽管为此失去了自己的技能感到惋惜。 核心信息是对一种正在消逝的艺术形式的悲伤。作者预测未来手动编码将成为过去时代的遗物,并邀请其他资深开发者一同哀悼他们毕生致力于的技艺的逝去,即使他们也在适应以求生存。 这既是对进步的认可,又带有一种深刻的失落感。
内森·兰伯特(Nathan Lambert)的著作《从人类反馈中进行强化学习》(RLHF)是一个持续进行的项目,2025年全年及2026年初都有重大更新。该书最初于2025年4月完成(v0),之后根据编辑反馈进行了大量修改,截至2026年1月,其结构已进行重大重组,模仿了Manning书籍的结构。 主要新增内容包括关于工具使用和直接偏好优化(DPO)的章节,以及对推理、策略梯度和近端策略优化(PPO)相关部分的改进。本书还讨论了RLHF在产品开发中的应用,并融入了最新的研究成果。 兰伯特感谢了Costa Huang和Claude等人的贡献,以及更广泛的研究人员和GitHub贡献者。本书目前可在[https://rlhfbook.com](https://rlhfbook.com)在线阅读,引用方式为Lambert, 2025。
## 斯多葛主义:生活的基础
斯多葛主义起源于古希腊,并在罗马得到完善,是一种实用的哲学,专注于应对人生的不确定性。其核心在于探究真正属于我们控制范围内的东西——我们的思想和判断——以及了解这些后我们应该如何生活。其他一切,包括外部事件和别人的行为,都超出了我们直接的影响范围。
斯多葛主义由季提乌姆的芝诺创立,受到犬儒学派哲学家如克拉底的影响,他们提倡简朴和摆脱欲望。斯多葛主义演变成了一条通往内心自由的结构化道路。关键人物如马可·奥勒留(一位哲学家皇帝)、爱比克泰德(一位前奴隶)和塞内卡(一位尼禄的富裕顾问),展示了这种哲学的适应性。
核心信条包括专注于**美德**——智慧、正义、勇气和自律——作为唯一的善,接受我们无法改变的事物(**命运之爱**),并理解情绪是判断而非不可控制的力量。**控制二分法**至关重要:通过关注内在反应并根据**自然**(理性和现实)生活,我们可以培养韧性和平和。
斯多葛主义不是关于压抑感觉,而是通过清晰和接受来掌握它们。它是一套建立性格和过上有意义的生活的工具,无论外部环境如何。这是一个基础概述,未来计划进一步探讨这些概念。
## 布加勒斯特的小小胜利:教堂
由建筑师斯特凡·帕瓦卢塔领导的Vinklu,将布加勒斯特一个难以置信的狭窄地块改造成了“教堂”,这是一家引人注目的咖啡店,展示了在极端限制下的创新设计。这个463平方英尺的空间升起为一个戏剧性的三角棱镜,最大化了之前无法使用的地块。
“教堂”几乎完全覆盖着三层玻璃,像一个充满光明的灯塔,折射日光并在夜间发光。异地预制最大限度地减少了浪费和干扰,轻型钢框架支撑着透明的外立面。巧妙地,设计*融入*了一棵成熟的树木,增强了建筑与自然的联系。
内部,浅色木材营造出一种温暖、诱人的氛围,由于高耸的屋顶线条,空间感出人意料地宽敞。“教堂”证明了有影响力的建筑并不需要大面积的占地,它提供了一种独特的城市体验,以及对居住狭小空间的新视角。
## 软件工厂与代理AI的兴起
StrongDM 公开详细介绍了其“黑暗工厂”软件开发方法——一种AI编码代理在*无需*人工干预的情况下编写、测试和完善代码的系统。这建立在最近的LLM进展之上,例如Claude Opus 4.5和GPT 5.2,它们在可靠地遵循复杂的编码指令方面表现出显著的飞跃。
其核心原则:**不编写或审查人工代码。** 为了确保质量,StrongDM 采用“场景测试”——使用与代理程序分离的详细“用户故事”,并通过“满意度”指标(概率成功率)进行评估。 关键是,他们构建了一个“数字孪生宇宙”——AI克隆的外部服务副本(Okta、Jira、Slack 等),从而实现大规模的、不受限制的测试。
这种方法,得益于“基因输血”(模式提取)和“Semports”(代码移植)等工具,出人意料地具有成本效益。StrongDM 认为,每月至少 1,000 美元的代币支出*每位工程师*表明对 AI 能力的投资充足。他们甚至开源了组件,包括其核心代理程序(“Attractor”)的规范和“AI 上下文存储”(cxdb)。这代表着软件工程的潜在转变,将开发者推向构建和监控*构建*代码的系统。
## Al Lowe:超越休闲装劳瑞
这次对游戏开发者Al Lowe的采访揭示了他比他最著名的作品《休闲装劳瑞》更为广阔的职业生涯。虽然他以与Sierra合作开发的标志性系列游戏而闻名,但Lowe的早期作品涵盖了众多游戏,并展现了多样化的技能。他讲述了在Sierra工作的16年,为26款产品做出贡献——从拼写程序到《唐老鸭乐园》,以及他独特的交付完成作品的策略,*在*寻求广泛意见之前。
对话还深入探讨了Lowe游戏开发之外的爱好:对模型火车(目前是N比例)一生的热爱,以及在多个乐队中演奏萨克斯管的奉献精神。他回忆了幽默的轶事,包括在挪威的医疗紧急情况,以及穿越挪威山脉的灾难性火车旅行。
Lowe反思了游戏的发展,哀叹了游戏重心从解谜和深思熟虑的游戏玩法上转移,并分享了他对Sierra最终衰落的见解,包括历史游戏资料的悲惨损失。他还讨论了他独特的设计选择,例如以“你”称呼玩家,以及许多Sierra冒险游戏中臭名昭著、极具挑战性的楼梯。最终,这次采访描绘了一个富有创造力、多才多艺的个体,他对游戏的影响远远超出了一个单一的、具有暗示性的主角。