## Slaterform:一个可微分 Hartree-Fock 引擎
Slaterform 是一个新颖的、使用 JAX 构建的可微分 Hartree-Fock 引擎,能够进行基于梯度的分子优化。它原生计算电子积分,并支持从 Basis Set Exchange 库获取的标准基组。
其核心优势在于提供可微分的分子能量函数。这使得它能够轻松与 JAX 优化循环(例如使用 Optax 的循环)集成,以优化分子几何结构。示例展示了从扁平初始构型优化甲烷至四面体形状。
Slaterform 可以计算诸如水分子(使用 STO-3G 基组)的能量和电子密度,并以 cube 文件等格式输出数据,以便使用 3dmol 等工具进行可视化。
该项目是开源的,经过 pytest 的全面测试,并包含覆盖率分析。它为量子化学及相关领域的研究和开发提供了一个强大的工具。
## 可靠性通过验证:摘要
本报告详细介绍了实验,证明了自动化网页交互的可靠性源于强大的*验证*,而不仅仅是更大的模型或更多的视觉数据。核心思想是将网页视为结构化数据——角色、文本、几何形状——并使用明确的断言来控制每个步骤,从而有效地创建一个“适用于代理的Jest”测试框架。
进行了四次亚马逊购物流程的运行,逐渐提高自主性。一个关键结果是:使用小型(约30亿参数)本地执行器与更大的规划器(DeepSeek-R1)配对,并由Sentience的验证层引导,成功完成了完全自主的运行。这与依赖视觉模型形成对比,视觉模型容易产生歧义和静默失败。
验证过程通过界面设计和过滤显著减少了token的使用量(初步测试中减少了约43%)。失败表现为明确的不匹配,从而实现调试,而不是被“进度”掩盖。该系统利用三模型堆栈:一个生成步骤的规划器,一个执行动作的执行器,以及一个确保结果符合预期的验证器。
最终,研究结果表明,一种确定性的、以验证为中心的方法使更小、本地的模型可行且可靠,在成本、隐私和可调试性方面具有优势。这优先考虑*结构而非像素*和*验证而非智能*。