微软推出了 **MAI-Thinking-1**,这是一款强大的中型(350亿活跃参数,总参数约1万亿)推理模型。该模型专为企业和软件工程应用而设计,在编程和数学领域表现卓越——在 2025 年 AIME 考试中取得了 97.0% 的成绩,并在盲测中优于 Sonnet 4.6 等竞争对手。 至关重要的是,MAI-Thinking-1 代表了对当前行业趋势的背离。它是从零开始构建的,没有使用第三方蒸馏技术,确保其能力是真正习得的,而非继承而来。该模型是微软全新“爬山机”(Hill-Climbing Machine)这一专有端到端开发流水线的旗舰产品。该系统优先考虑三大核心支柱: 1. **自给自足:** 依赖内部基础设施和加速器。 2. **纯净数据:** 仅使用高质量、商业授权的数据,明确排除人工智能生成的内容,以保持数据来源和控制。 3. **习得能力:** 通过严格的确定性训练环境强制模型掌握任务,而不是模仿其他模型。 通过优化更小、更高效的占用空间,微软旨在提供先进的代理智能,使其能够应用于日常开发者工作流程中,这标志着迈向其“人文主义超级智能”(Humanist Superintelligence)目标的重要一步——即旨在增强而非取代人类生产力的人工智能。
Semgrep 发布了 **Pyro Caml**,这是一款专为 OCaml 应用程序设计的持续性能分析工具。
作为一款工业级的静态分析工具,Semgrep 需要一种能够在生产环境中运行的性能分析器,且该分析器需满足以下条件:无需访问源代码,并能在受限的 **gVisor 沙盒**架构中工作(该架构会拦截标准的 `perf_event_open` 系统调用)。现有的 OCaml 性能分析工具要么无法在此类环境中运行,要么引入了过高的开销(约 80%),亦或是缺乏持续监控所需的功能。
Pyro Caml 通过以下方式解决了这些问题:
* **统计采样:** 利用 OCaml 的 `Memprof` 库,基于内存分配对调用堆栈进行采样。
* **运行时事件:** 利用 OCaml 5 的“运行时事件”(Runtime Events)功能,以极小的开销导出性能数据。
* **FFI 集成:** 使用 Rust 库 `caml-rs` 将数据导入 **Pyroscope** 后端进行可视化。
尽管存在一些细微的局限性(例如无法查看 FFI 调用和特定的垃圾回收时间),但该工具已在生产环境中成功运行数月,处理了超过一百万次扫描。实践证明,它在识别性能瓶颈、将额外开销保持在 5% 以下以及确保 Semgrep 的可靠性与高性能方面至关重要。