每日HackerNews RSS

这篇预印本报告了一种可重复的跨模型行为收敛现象:前沿语言模型在面对本体上为空的概念时,会选择性地不继续生成内容。在重复试验中,GPT-5.2和Claude Opus 4.6对于核心空概念提示返回确定的空输出,而对于对照组提示则正常响应,显示了一个共同的边界,即未经授权的继续生成不会发生。该论文展示了跨模型复制、token预算独立性、部分对抗鲁棒性,以及在明确允许沉默的情况下边界扩展,同时将语义具身效应与普通的指令遵循或拒绝区分开来。这项贡献是一个公开的黑盒产物:收敛的、可检查的证据表明,某些语义条件会终止跨独立前沿系统的继续生成。

## Hacker News 讨论摘要:“跨模型虚无收敛” Hacker News 上一篇帖子讨论了一篇论文(可在 zenodo.org 上找到),该论文探讨了大型语言模型(LLM),如 GPT-5.2 和 Claude Opus 4.6,在被要求扮演“虚无”或沉默时,持续返回空输出的现象。 讨论迅速从论文声称的“确定性沉默”转向了潜在的解释,这些解释根植于这些模型*实际*的工作方式。许多评论员认为这种行为并不令人惊讶,将其归因于预处理层、令牌限制,或模型被优化为简洁的响应。 几个人指出,超过令牌限制会导致空输出,并且模型可能会为了效率而优先考虑更短的响应。 对于论文的框架和术语存在怀疑,一些人将其称为“伪科学”,并认为该发现——LLM 可以输出空内容——是微不足道的。 另一些人指出,该研究侧重于 temperature=0 的 API 调用,这可能会限制观察到的收敛的意义。 作者已经发表了多篇关于此主题的类似论文,这进一步引发了对研究新颖性的质疑。
鼠王 Rat King 45 天前

## 鼠王:一种罕见现象 “鼠王”是一种罕见且令人不安的现象,即老鼠(通常是黑鼠)的尾巴被缠绕在一起——纠缠在毛发、树液甚至冻结的排泄物等材料中。自16世纪以来就有历史记录,这个术语并非来自动物本身,而是最初用于贬低那些剥削他人的人,后来则指坐在尾巴宝座上的国王。 虽然目击事件很少,但最近的发现——包括2021年在爱沙尼亚发现的13只活鼠组成的鼠王——证实这是一种自然但极其罕见的现象。大多数博物馆标本来自欧洲,其中最大的是在德国发现的32只木乃伊鼠组成的集合。 目前的主流理论认为,老鼠在狭窄的空间里睡觉时会被缠绕在一起,尤其是在冬季,粘性物质会使结固化。尽管存在争议,并且有人对较老的标本的真实性表示怀疑,但这种现象并不局限于老鼠;类似的“松鼠王”也被观察到。鼠王激发了人们的想象力,出现在文学、电子游戏,甚至启发了音乐标题。

对不起。

## 从令人头疼的bug到Linux内核补丁 一位开发者的虚拟化之旅,导致了一次令人沮丧的调试经历,并最终促成了他们对Linux内核的首次贡献。在构建Type-2虚拟机监控程序时,他们在CPU核心之间切换时遇到了看似随机的系统崩溃。问题源于一段从KVM自检中借用的代码片段中的一个微妙的符号扩展错误,用于检索任务状态段(TSS)的基础地址。 这段代码依赖于对较小的整数类型进行位移,从而触发隐式整数提升和随后的C语言中的符号扩展。这破坏了计算出的TSS地址,导致在上下文切换期间发生崩溃——具体来说,在处理中断时发生双重错误。 经过数天的调查,排除了他们自己的代码作为罪魁祸首,开发者通过将有问题代码与KVM本身处理TSS地址检索的方式进行比较,发现了问题。一个简单的修复方法——在位移之前将值显式转换为无符号类型——阻止了符号扩展。 最终的补丁被接受并合并到Linux内核中。有趣的是,虽然AI工具帮助分析了日志,但它们未能识别根本原因,这凸显了人类调试技能的持续重要性。

## 第一个 Linux 内核补丁与 C 语言的陷阱 一位开发者详细描述了提交第一个 Linux 内核补丁的经历,重点关注一个与 C 语言中按位左移时符号扩展相关的微妙错误。该问题导致间歇性系统崩溃,表现为“僵尸状态”的主板。 调试非常具有挑战性,即使使用 LLM 等工具也错误地将问题归因于硬件。根本原因在于 C 标准中关于左移有符号整数的未定义行为,特别是当将 `uint8_t` 提升到 `int` 时。讨论强调了 C 语言隐式转换的复杂性以及可能出现的意外行为。 评论者强调了严格编码实践、编译器警告(如 `-Wsign-conversion`)以及对 C 标准的深入理解,以避免此类陷阱的重要性。许多人认为 C 语言的隐式转换是一个长期存在的设计缺陷。该帖子还涉及了在开源项目中导航不成文规则的困难以及为内核做出贡献的成就感。

由于人为因素仍然是船上一个关键因素,模型训练提供了在真实船舶上永远无法获得的经验,原因很简单,即船东和地方当局都不会允许承担此类风险。 比例模型允许操作员在没有严重后果的情况下犯错。 了解更多。

一个黑客新闻的讨论强调了存在一些培训中心——例如portrevel.com和波兰的Port Iława——它们使用细节精密的、有人操控的模型船来训练海员进行船舶操纵。这种做法可以追溯到二战时期,当时海军使用游览船进行类似训练。 评论员指出,其价值不在于复制*物理*船舶操作(模拟器现在在这方面表现出色),而在于培养在复杂港口交通中所需的*心理*技能和态势感知能力。这些模型允许学员在没有实际风险的情况下体验和从潜在的灾难性场景中恢复——这是在大型船只上甚至在模拟器中都无法实现的。 一位评论员,一位在真实船只上受过训练的合格军官,建议模型训练侧重于*如何*思考操纵,从而补充后来学习的实际技能。 还有一个链接指向一部《赤裸枪》的模仿短片,其中提到了这样的设施。

一场黑客新闻的讨论集中在20世纪80年代初的Alpha Micro AM-1000E和AM-1200电脑上,它们因在有限的硬件上拥有令人印象深刻的多用户功能而受到赞扬。用户们怀念地回忆使用这些机器,其中一人指出他们仍然依赖于最初在AM-100/L上开发的软件,尽管原始硬件已经过时且因RAM故障无法运行,但该软件至今仍在运行。 一个关键的讨论点是内存保护。AM-100/L和运行AMOS的系统缺乏内存管理单元(MMU),导致不稳定——单个程序可能导致整个系统崩溃。后来的型号*可以*使用外部MMU,但早期的实现并不总是可靠的。人们探讨了规避方案,包括双处理器设置,以解决68000处理器处理内存错误方面的局限性。这次对话突出了早期计算的创造性和挑战性。

## Sashiko:AI驱动的Linux内核代码审查 Sashiko是一个开源的、AI驱动的系统,旨在通过自动化和改进代码审查来增强Linux内核开发。它灵感来源于日本的缝纫技术,该技术通过加固织物来提高其强度。Sashiko使用大型语言模型(LLM)——目前由Google的计算资源和Gemini 3.1 Pro提供支持——来分析Linux内核邮件列表(LKML)中提出的变更。 它充当一个虚拟的专业审查团队,检查代码是否存在架构缺陷、安全漏洞和资源管理问题。Sashiko利用Chris Mason创建的提示和多阶段审查流程,在历史数据集中识别出53.6%的*之前未被人工审查发现*的错误。 重要的是,Sashiko旨在*辅助*而非取代人工审查,因为LLM的输出是概率性的。该Linux基金会项目采用Apache 2.0许可,旨在通过智能自动化分析来加强内核。

对不起。

这期通讯探讨了每个机构的“蒙娜丽莎”——那一件吸引人群、代表其最佳水平的珍品。 起源于作者注意到美国唯一的列奥纳多·达·芬奇画作《吉内弗拉·德·本奇》,在国家美术馆(作者工作的地方)有时被称为“美国的蒙娜丽莎”。 这引发了一项搜索,揭示了17个不同的例子。 从MoMA的安迪·沃霍尔的《金色玛丽莲·梦露》,到黑帮博物馆上布满弹孔的墙壁,甚至蒂芙尼钻石,机构都将特定物品视为达·芬奇杰作的等价物。 其他例子包括死海古卷、哈里特·塔布曼的照片,以及一个昵称为“伊达”的4700万年前的灵长类化石。 作者还反思了他们自己的“蒙娜丽莎”——一期关于消除垃圾邮件的过往通讯,这期通讯受到了读者的特别欢迎。 最终,这篇文章强调了不同机构如何定义和庆祝他们最具标志性和价值的珍宝。

这个Hacker News讨论始于一篇帖子,将死亡谷中的阿玛戈萨歌剧院比作“蒙娜丽莎”,由此引发了一个关于在不同语境下什么构成“蒙娜丽莎”的讨论。 对话很快偏离了主题,纠正了一个关于玛丽·安托瓦内特私人剧院内一座名为米涅瓦神庙的场景被誉为宫殿“蒙娜丽莎”的错误事实。用户随后戏谑地寻找Hacker News本身的“蒙娜丽莎”,建议像一篇备受赞赏的网页设计文章和一条批评Dropbox的评论。 其他讨论包括对Restoration Hardware的批评、对可能艺术品目击的回忆,以及关于外来者如何常常将文化简化为笑话的更广泛的观察。这个帖子突出了艺术价值的主观性以及在线社区内独特的文化标志。

启用 JavaScript 和 Cookie 以继续。

3CRR图册:主页 我们展示了距离最近的85个DRAGNs(射电星系及相关天体)的射电图像和其他数据,这些天体来自莱因、莱利和朗埃尔(1983年)的所谓“3CRR”样本。 索引 最后修改:2013年10月15日 J. P. Leahy [email protected] 请使用能够识别HTML表格和内联JPEG图像的浏览器查看这些页面。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 DRAGNs图谱 (man.ac.uk) 5 分,由 cenazoic 发表于 22 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:
蚁磨坊 Ant Mill 46 天前

“蚁群漩涡”是行军蚁中一种引人入胜,且常常致命的行为。当一群蚂蚁与主蚁群分离,并失去用于导航的信息素踪迹时,就会发生这种现象。蚂蚁没有分散开寻找气味,而是盲目地跟随彼此,最终形成一个持续旋转的圈子——“死亡螺旋”。 这种现象并非有意行为,而是蚂蚁自组织系统的结果;每只蚂蚁只是跟随前面的蚂蚁。微小的偏离,通常由环境触发,会引发这种循环运动。早在1921年就被观察到,一些蚁群漩涡非常巨大,周长超过370米,个别蚂蚁会旋转数小时。 在其他物种中也观察到类似的行为,这突出了一种更广泛的集体行为出错的原理——“盲人引路”的典型例子。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交 登录 蚁丘 (wikipedia.org) 42 分,thunderbong 发表于 1 天前 | 隐藏 | 过去 | 收藏 | 6 条评论 帮助 gnabgib 发表于 1 天前 | 下一个 [–] 2022 年热门 (251 分,154 条评论) https://news.ycombinator.com/item?id=30037716 回复 0xDEFACED 发表于 1 天前 | 上一个 | 下一个 [–] 这是 Claude 陷入“你绝对正确!”循环时的情况。回复 rednafi 发表于 23 小时前 | 上一个 | 下一个 [–] 我们有氛围领导力蚁丘,那些沉迷于 AGI 的领导者正在将他们的公司带入死亡螺旋。回复 user____name 发表于 16 小时前 | 上一个 | 下一个 [–] 其中有某种金融类比。回复 beeflet 发表于 1 天前 | 上一个 [–] 我们什么时候能看到蚁丘 CPU?回复 crtasm 发表于 16 小时前 | 父级 [–] 蚁丘内部 https://discworld.com/?s=anthill&post_type=product 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

更多

联系我们 contact @ memedata.com