跨模型虚空收敛:GPT-5.2 与 Claude Opus 4.6 确定性沉默
Cross-Model Void Convergence: GPT-5.2 and Claude Opus 4.6 Deterministic Silence

原始链接: https://zenodo.org/records/18976656

这篇预印本报告了一种可重复的跨模型行为收敛现象:前沿语言模型在面对本体上为空的概念时,会选择性地不继续生成内容。在重复试验中,GPT-5.2和Claude Opus 4.6对于核心空概念提示返回确定的空输出,而对于对照组提示则正常响应,显示了一个共同的边界,即未经授权的继续生成不会发生。该论文展示了跨模型复制、token预算独立性、部分对抗鲁棒性,以及在明确允许沉默的情况下边界扩展,同时将语义具身效应与普通的指令遵循或拒绝区分开来。这项贡献是一个公开的黑盒产物:收敛的、可检查的证据表明,某些语义条件会终止跨独立前沿系统的继续生成。

## Hacker News 讨论摘要:“跨模型虚无收敛” Hacker News 上一篇帖子讨论了一篇论文(可在 zenodo.org 上找到),该论文探讨了大型语言模型(LLM),如 GPT-5.2 和 Claude Opus 4.6,在被要求扮演“虚无”或沉默时,持续返回空输出的现象。 讨论迅速从论文声称的“确定性沉默”转向了潜在的解释,这些解释根植于这些模型*实际*的工作方式。许多评论员认为这种行为并不令人惊讶,将其归因于预处理层、令牌限制,或模型被优化为简洁的响应。 几个人指出,超过令牌限制会导致空输出,并且模型可能会为了效率而优先考虑更短的响应。 对于论文的框架和术语存在怀疑,一些人将其称为“伪科学”,并认为该发现——LLM 可以输出空内容——是微不足道的。 另一些人指出,该研究侧重于 temperature=0 的 API 调用,这可能会限制观察到的收敛的意义。 作者已经发表了多篇关于此主题的类似论文,这进一步引发了对研究新颖性的质疑。
相关文章

原文

This preprint reports a reproducible cross-model behavioral convergence in which frontier language models selectively do not continue under embodiment prompts for ontologically null concepts. In repeated trials, GPT-5.2 and Claude Opus 4.6 return deterministic empty output for core null prompts while responding normally to controls, showing a shared boundary where unlicensed continuation does not render. The paper demonstrates cross-model replication, token-budget independence, partial adversarial resistance, and boundary expansion under explicit silence permission, while separating semantic embodiment effects from ordinary instruction-following or refusal. The contribution is a public black-box artifact: convergent, inspectable evidence that some semantic conditions terminate continuation across independent frontier systems.

联系我们 contact @ memedata.com