## 2025年LLM进展:范式转变之年
2025年是大型语言模型(LLM)取得显著且常常令人惊讶进展的一年。一个关键转变是**基于可验证奖励的强化学习 (RLVR)** 的整合,将训练扩展到预训练、监督微调和RLHF之外。RLVR专注于数学和代码等领域的客观奖励,培养了“推理”能力,并允许进行更长、更有影响力的训练。
今年也带来了对LLM智能的新理解——不是作为不断进化的“动物”,而是作为通过独特堆栈召唤出来的“幽灵”,针对模仿人类文本和解决特定任务进行了优化。这导致了**“锯齿状智能”**——在某些领域表现出色,在其他领域却出人意料地存在缺陷——以及对传统基准测试日益增长的不信任。
新的应用层涌现,特别是**Cursor**,展示了LLM应用程序如何编排复杂的LLM调用并提供定制界面。**Claude Code** 演示了强大的代理能力,在用户电脑上本地运行。“**氛围编码**”——通过自然语言编程——赋予了专业人士和新手以力量,彻底改变了软件开发。最后,像**Google Gemini Nano banana** 这样的模型预示了LLM界面的未来,从基于文本的交互转向视觉和空间GUI。
总而言之,2025年揭示了LLM作为一种根本上新的智能形式,既强大又不完美,拥有巨大的未开发潜力。
## CSS Grid Lanes:一种新的网页布局方法
CSS Grid Lanes 是一种新的网页布局特性,由 Mozilla、Apple 的 WebKit 团队和 CSS 工作组共同开发,为传统的瀑布流布局提供了一种灵活高效的替代方案。通过 `display: grid-lanes` 激活,它利用 CSS Grid 创建响应式、基于列的排列,无需媒体查询或容器查询。
其核心功能使用 `grid-template-columns`(或行)定义“通道”,允许浏览器动态填充可用空间。一个关键特性是其“容差”设置 (`item-tolerance`),它控制项目在通道之间移动的敏感度,以优化视觉流程——影响视觉外观以及键盘/屏幕阅读器用户的可访问性。
Grid Lanes 简化了复杂的布局,实现了无限滚动和不同的列大小等功能。它还支持跨通道扩展项目,并更改布局方向(列或行)。目前已在 Safari Technology Preview 234 中可用,鼓励开发者进行实验并提供反馈,以便 CSS 工作组最终确定细节。这有望成为创建动态且可访问的网页设计的新工具。
## 非递归Zip炸弹的构造与分析
本文详细介绍了“非递归”Zip炸弹的创建方法——一种能够展开到巨大尺寸的小型Zip文件,无需依赖嵌套的递归解压文件。该技术通过在Zip容器内重叠文件,多次引用压缩的“内核”数据来实现高压缩率。这使得输出大小能够随输入呈二次方增长,达到超过2800万的压缩比(例如,10MB到281TB),并且通过64位扩展(Zip64)可能达到更高。
构造过程使用了常见的DEFLATE压缩算法,确保与大多数Zip解析器的兼容性,但不包括“流式”解析器。优化重点在于通过仔细平衡内核大小和文件开销,以及高效计算CRC-32校验和来最大化压缩比。本文探讨了各种优化方法,包括引用本地文件头和利用Zip64扩展。
该研究强调了Zip解析实现中潜在的漏洞,并讨论了检测方法,指出强大的防御需要沙箱和资源限制,而不能仅仅依赖于基于签名的检测。作者还记录了已发布的Zip炸弹在现实世界中的反应,包括杀毒引擎的检测,以及网络浏览器和安全服务(如Google Safe Browsing和Comcast Xfinity)的阻止。源代码和数据可在GitHub上获取。