## 太赫兹信号突破,利用“量子天线” 华沙大学的研究人员开发了一种新方法,可以准确测量太赫兹(THz)辐射——电磁波谱的一个区域,具有先进成像和6G通信等巨大应用潜力,但历史上难以精确测量。他们的方案利用制备成高灵敏度“量子天线”的“里德堡原子”。 这个创新系统不仅*检测*太赫兹信号,还精确*校准*了该范围内的“频率梳”——一种超精确的电磁标尺。通过将微弱的太赫兹信号转换为可检测的光,并利用里德堡原子固有的校准能力,该团队首次成功测量了太赫兹频率梳的单个“齿”。 这一突破克服了太赫兹计量学中的一个主要障碍,为校准仪器提供了一个参考标准,并实现了高度精确的测量。重要的是,该系统在室温下运行,为经济高效且具有商业可行性的太赫兹技术铺平了道路,并为这个激动人心的领域的研究和开发开辟了新的途径。
## tvterm:一个 Turbo Vision 终端模拟器
tvterm 是一个实验性的终端模拟器,使用 Turbo Vision 框架构建,旨在展示其高级功能,例如 24 位色支持。它利用 Paul Evan 的 libvterm – Neovim 和 Emacs 也使用的库 – 提供终端模拟能力,并与 Unix 和 Windows 10 (1809+) 兼容。
构建 tvterm 需要克隆 GitHub 仓库(包括子模块,使用 `git clone --recursive`),CMake,一个 C++14 编译器,以及 libvterm、libncursesw (Unix) 等依赖项,以及可选的 libgpm (Linux)。这些依赖项可以与 tvterm 一起构建,也可以通过 CMake 选项链接到系统提供的版本。
目前 tvterm 仍在开发中,旨在展示 Turbo Vision 在现代终端应用程序中的潜力。你可以在 [https://github.com/magiblot/tvterm](https://github.com/magiblot/tvterm) 找到该项目和构建说明。
## ClickHouse 聚合性能改进 - 总结
这项工作(PR #87366)解决了在看似相同的 ClickHouse 查询中观察到的显著性能差异,特别是那些使用 `uniq()` 聚合的查询。 根本原因在于 ClickHouse 处理分组值的方式——将它们视为 `UInt16` 与更大的类型——从而影响了使用的聚合数据结构。
ClickHouse 使用基于数组或标准哈希映射来进行聚合。 当按较小的数字分组时,使用数组,从而可以有效地并行合并聚合状态。 较大的值会触发标准哈希映射,从而阻碍并行化。 最初的查询使用了 `UInt16`,导致较慢的两级哈希映射合并。 添加 `0 +` 强制使用 `UInt64`,从而实现更快的单级合并。
该实现侧重于通过在线程之间分配工作而无需竞争条件,从而为单级哈希映射启用并行合并。 开发涉及克服内存损坏问题(与线程不安全的 `DB::Arena` 内存管理相关)以及优化琐碎的聚合函数(如 `count()`),在这些函数中,并行化的开销超过了收益。 火焰图和仔细的日志记录对于识别性能瓶颈和调试至关重要。 最终解决方案包括优化,以在并行合并期间保持哈希映射索引以提高性能。
## 用音乐可视化重塑人工智能:一种新方法
Positron 正在通过专注于音乐可视化来应对现代人工智能开发中的挑战——大规模、反馈循环慢和成本高昂。他们认为这是一个理想的“原始”问题,对缺陷具有容忍性,并能使用更小的 AI 模型进行快速迭代。他们的开源项目 µTate 旨在通过为开发者提供贡献平台并获得经济奖励来启动一种名为 PrizeForge 的筹款解决方案。
核心思想是*远离*当前越来越大的人工智能模型趋势,转向“小型人工智能”——利用诸如权重重用和贪婪粒子方法等技术来降低计算需求。音乐可视化独特地受益于“幻觉”——意想不到的、迷幻的结果——将模型缺陷转化为理想特征。
µTate 使用 Rust 构建,利用 Vulkan 等现代图形 API,并专注于高效的实时性能。该项目强调开放开发,欢迎贡献,并旨在创建一个充满活力的社区,尤其是在本地 LLM 爱好者群体中。最终,Positron 设想了一个良性循环,即快速开发、用户反馈和经济激励,证明即使使用更小、更易于访问的 AI,也可以取得重大进展。
## 2025年LLM进展:范式转变之年
2025年是大型语言模型(LLM)取得显著且常常令人惊讶进展的一年。一个关键转变是**基于可验证奖励的强化学习 (RLVR)** 的整合,将训练扩展到预训练、监督微调和RLHF之外。RLVR专注于数学和代码等领域的客观奖励,培养了“推理”能力,并允许进行更长、更有影响力的训练。
今年也带来了对LLM智能的新理解——不是作为不断进化的“动物”,而是作为通过独特堆栈召唤出来的“幽灵”,针对模仿人类文本和解决特定任务进行了优化。这导致了**“锯齿状智能”**——在某些领域表现出色,在其他领域却出人意料地存在缺陷——以及对传统基准测试日益增长的不信任。
新的应用层涌现,特别是**Cursor**,展示了LLM应用程序如何编排复杂的LLM调用并提供定制界面。**Claude Code** 演示了强大的代理能力,在用户电脑上本地运行。“**氛围编码**”——通过自然语言编程——赋予了专业人士和新手以力量,彻底改变了软件开发。最后,像**Google Gemini Nano banana** 这样的模型预示了LLM界面的未来,从基于文本的交互转向视觉和空间GUI。
总而言之,2025年揭示了LLM作为一种根本上新的智能形式,既强大又不完美,拥有巨大的未开发潜力。