每日HackerNews RSS

## Claude “超思考”更新:摘要 先前用于解锁Claude完整推理能力(31,999个思考token)的“超思考”关键词现已弃用。对于支持的模型(Opus 4.5, Sonnet 4/4.5, Haiku 4.5),扩展思考已**自动启用**,默认值为相同的31,999个token。 然而,一项隐藏功能允许拥有64K输出模型的用户通过设置环境变量`MAX_THINKING_TOKENS=63999`将思考预算**翻倍至63,999个token**。 这为复杂任务解锁了显著更多的推理能力。 并非*总是*更多的思考token更好——它们会增加成本和延迟。 31,999个token适用于大多数编码和调试,而63,999个token则有利于复杂系统设计和性能优化。 可以通过设置`MAX_THINKING_TOKENS=0`来禁用思考。 这一转变反映了更广泛的行业趋势,即集成推理,这得益于研究表明,增加“测试时计算量”——通过这些思考token实现——可以扩展模型的计算能力并提高性能。

Ultrathink 已弃用 & 如何在 Claude Code 中启用 2 倍思考令牌 (decodeclaude.com) 18 分,moona3k 发表于 7 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 teruakohatu 发表于 34 分钟前 [–] 启动后无法更改的环境变量,或配置文件变量,是最糟糕的接口。为什么不直接使用“ultra^2 think”关键词? 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

奥斯汀·亨利被3Blue1Brown提出的一个谜题所吸引:一只瓢虫从时钟的12点开始,随机移动到相邻的刻度,直到访问所有刻度。它最终停在某个特定数字(例如6)上的概率是多少? 起初,亨利猜测6最有可能,因为它的距离较远,但他的直觉被证明是错误的。他构建了一个模拟器来测试他的假设,期望基于与起点的接近程度出现某种模式。然而,经过数千次运行(最终超过10,000次),模拟器揭示了一个令人惊讶的结果:**每个数字(1-11)都有相同的概率1/11作为最终停靠点。** 这个谜题突出了直觉在随机游走问题中很容易被误导。亨利还提出了一个后续问题:瓢虫访问所有12个刻度平均需要多少步?邀请进一步探索。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 模拟瓢虫时钟谜题 (austinhenley.com) 6 分,由 azhenley 2小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 复利:总结 复利不仅是在你的初始投资(本金)上赚取利息,还在之前的利息积累上赚取利息——从而导致指数增长。它常被称为“世界第八大奇迹”,理解它对于财富积累至关重要。 核心公式是 **A = P(1 + r/n)^(nt)**,其中A是最终金额,P是本金,r是年利率,n是复利频率,t是年数。更频繁的复利(每日与每年相比)会带来更高的回报。 一个有用的捷径,**72法则**,可以估算翻倍时间:**翻倍年数 = 72 / 利率**。 要最大化复利:**尽早开始投资**,**定期投入**,**再投资收益**,**寻求更高的利率**,并**最小化费用**。时间和一致性是你利用复利力量的最大优势。

## AI 重新点燃一位前程序员的热情 一位前程序员对传统开发的挑战感到幻灭,但通过 AI 驱动的“氛围编程”重新发现了他们的热情。在金融领域工作多年后,他们发现现有的复利计算器不足,并受到 Claude 等工具易用性的启发,决定自己构建一个。 在两周内,花费了 100 美元的 API 费用,他们创建了 60 多个计算器——从复利开始,扩展到各种金融和实用工具,并托管在 [calquio.com](https://calquio.com)。AI 处理了编码的“繁重工作”,让创建者专注于架构、用户体验和领域专业知识。 这次经历并非为了成为超级开发者,而是为了消除构建障碍。许多评论者分享了类似的经历,他们多年后重返编码,并被 AI 赋能,可以快速原型设计并实现长期以来的想法。 这篇文章引发了关于 AI 作为一种新型“终端用户编程”及其 democratize 开发潜力的讨论。

启用 JavaScript 和 Cookie 以继续。

CD Projekt Red (CDPR) 向一款流行的、付费的《赛博朋克2077》VR模组发出了DMCA下架通知。模组制作者并未被指控过度盈利,而是被指控分发付费修改内容。 Hacker News上的讨论集中在这一行为的合法性和先例问题上。许多人认为该模组并未助长盗版——用户仍然需要*拥有*游戏——只是增加了功能,类似于汽车配件。一个关键问题是,通过DLL和内存写入修改游戏代码,*不*直接使用游戏资源,是否构成侵犯版权。 此次下架也被视为不一致,因为许多《赛博朋克2077》模组制作者通过Nexus Mods等平台赚取收入。一些人推测,区别在于直接*销售*模组与通过广告支持下载产生的收入。这一情况引发了对游戏模组未来以及开发商潜在过度干预的担忧。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 天文摄影可见性绘图和规划工具 (airmass.org) 4 分,NKosmatos 发表于 2 小时前 | 隐藏 | 过去的 | 收藏 | 1 条评论 lanthade 发表于 15 分钟前 [–] 有趣的工具,如果我对天空中漂浮的东西了解更多,可能会非常有用。我通常只关心在黑暗的夜晚拍摄银河系核心。我没有足够的领域知识来用这个工具弄清楚。我使用 PhotoPils 在我的 iOS 设备上进行天文摄影规划,这对于我有限的知识水平来说效果很好。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## OpenCode AI Agent 漏洞:严重安全风险 流行的开源AI编程代理OpenCode最近遭受了一个关键的远程代码执行(RCE)漏洞,其危险性和易利用性远高于许多其他漏洞。与需要特定条件(如过去Bottlerocket OS问题)的复杂漏洞利用不同,这个漏洞——存在于v1.1.10版本之前——允许攻击者通过OpenCode的HTTP服务器,利用暴露的shell命令、终端会话和文件访问端点来执行任意代码。 这意味着恶意行为者可以获得运行易受攻击版本的系统的完全控制权,可能安装后门、窃取数据或破坏云资源。该风险因代理固有的权限而加剧——通常镜像用户的权限,从而授予对敏感数据的访问权限,例如SSH密钥和云凭据。 除了RCE之外,OpenCode还容易受到提示注入攻击,可能允许攻击者操纵AI的行为并进一步破坏系统。该事件凸显了AI代理领域的一个关键差距:缺乏强大的遥测和审计工具。目前,了解代理*如何*被破坏几乎是不可能的,这使得潜在的数千名开发人员和公司面临风险,且几乎没有补救措施。作者认为,构建“任务控制”——对代理操作的全面监控和记录——对于安全和可扩展的AI开发至关重要。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 我们拥有你们所有的OpenCodes (johncodes.com) 11 分,jpmcb 2小时前 | 隐藏 | 过去的 | 收藏 | 1 评论 geoffmanning 0分钟前 [–] 这里让我困惑的一件事是全文使用的过去时。这个CVE似乎既描述了过去,又描述了现在,但现在的证据却…没有呈现。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

西班牙南部科尔多瓦附近发生一起高速列车相撞事故,已造成至少21人死亡,预计伤亡人数还会上升。事故发生时,一列从马拉加开往马德里的列车脱轨,并与一列迎面驶向韦尔瓦的列车相撞,造成73人以上受伤,其中多人伤势严重。 脱轨发生在一条笔直且近期翻新的轨道上,事故原因“非常奇怪”且目前未知,预计调查需要一个月时间。两列列车共载有约400名乘客。 紧急服务部门正在努力从残骸中救出幸存者,面临艰难的条件。相关部门正在为受害者家属提供支持,车站为亲属提供场所,红十字会提供心理辅导。马德里和安达卢西亚之间的所有铁路服务均已暂停。这起悲剧与西班牙2013年最严重的高速铁路事故相呼应,那次事故造成80人死亡。

至少21人在西班牙高速列车相撞事故中丧生 (bbc.com) 13点 由 akyuu 3小时前 | 隐藏 | 过去 | 收藏 | 3条评论 salynchnew 5分钟前 | 下一个 [–] 令人难过,但21人死亡仍然是美国道路交通事故死亡人数的一个缓慢的星期二。 回复dankwizard 0分钟前 | 父评论 | 下一个 [–] 火车事故不太寻常。我们已经知道美国人不会开车,但火车就像...你怎么能搞砸一条直线? 回复alphadatavault 3小时前 | 上一个 [–] 我对在Adamuz附近可怕列车相撞事故中丧生的人们的家人和亲人表示最深切的慰问。我的想法也与受伤者和所有受到这场悲剧影响的人们同在。在这深刻悲伤的时刻,我希望他们能在彼此和周围人的关怀中找到力量和支持。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## SIMD 探索:深入研究 AVX-512 性能与可编程性 本次探索研究了 SIMD(单指令多数据)范式,特别是 AVX-512,并将其与 CUDA 等 SIMT(单指令多线程)进行对比。作者在其他并行化方法方面经验丰富,旨在评估性能扩展性和编程复杂性。 以 K-Means 图像分割作为基准测试——这是一个计算密集型问题,非常适合 SIMD——该研究比较了标量代码、自动向量化代码(GCC 和 Intel 编译器)以及手动优化的 AVX-512 内联函数。自动向量化显示出有限的扩展性,远低于理论上的 16 倍潜力。内联函数在标量代码上实现了 7-8.5 倍的加速,更接近预期结果,但仍然需要大量的手动优化。 一个关键发现是,虽然 CUDA 抽象了 SIMD 的冗长性,但它引入了诸如 warp 差异和非合并内存访问等复杂性。SIMD 尽管底层,但提供了一条更直接的路径来达到硬件限制。作者认为,随着功能强大的 LLM 能够从标量版本生成优化的 SIMD 代码,显式 SIMD 编程可能会变得越来越可行,从而在硬件利用率和可管理的开发工作之间取得平衡。结论是积极的,表明 AVX-512 既具有高性能,又具有令人惊讶的可编程性,尤其是在 AI 辅助下。

这个Hacker News讨论围绕一篇关于AVX-512性能和可编程性的博文展开。一个关键点是“免费午餐”的结束(Dennard Scaling)以及日益专业化的硬件正在*迫使*开发者考虑底层优化以提高性能,尽管历史趋势是屏蔽程序员免受此类细节的影响。 评论者指出利用SIMD指令的难度——许多语言并未完全暴露它们,并且所需的技能是专门的。一位用户建议AVX-512性能提升需要仔细的内存访问模式(线性、可预测的访问产生高缓存命中率),而另一位则提出了针对特定指令(如`vpconflictd`)的解决方法。 最后一条评论赞扬C语言作为一种坚实的基础语言,允许专业化以及在性能至关重要时直接访问汇编或内联函数,反对过度复杂的编译器优化。

## 代码即所有:一种更简单的AI代理方法 当前的AI代理领域复杂多样,充斥着各种工具、记忆协议和技能。然而,一种激进的简化方案正在出现:**将代理限制为单一工具——代码执行。** 这种方法认为,“技能”是*学习的结果*,而非基础要求。 不同于提示代理*做*某事,仅代码代理*编写并运行代码*来实现目标。这意味着没有`bash`、`ls`或`grep`——只有`execute_code`。好处是什么?代理会生成一个“代码见证”——一个可重复、可验证的脚本——而不仅仅是答案。这允许对解决方案进行精确分析、调试和重用。 这种范式转变了关注点,从代理*使用哪些工具*转移到代理*生成什么代码*。虽然看似具有限制性,但它强制执行了一个可信赖的过程,尤其是在计算密集型任务中,传统代理常常会采取捷径或产生幻觉。 未来可能将这种方法与代理编排(例如使用自然语言来协调仅代码代理)和混合工具结合起来,将意图的技能与代码的精确性相结合。最终,提示和编程之间的界限可能会消失,从而带来更可靠、更强大的AI代理。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 仅代码代理 (rijnard.com) 8 分,由 emersonmacro 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

请启用 JavaScript 并禁用任何广告拦截器。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 [已标记] mizzao 21 分钟前 | 隐藏 | 过去 | 收藏 mizzao 21 分钟前 | 下一个 [–] 赠送文章链接:https://www.nytimes.com/2026/01/18/us/minneapolis-federal-ag... superkuh 13 分钟前 | 上一个 [–] ICE已经从一个移民执法机构转变为独裁者用来惩罚其政治敌人的秘密警察。它以300亿美元的预算运作,作为更大的1700亿美元移民计划的一部分并受到支持。我知道引用戈德温法则通常是不好的形式,但作为居住在双子城地区的人,ICE目前正像盖世太保一样行动。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

更多

联系我们 contact @ memedata.com