## 纽约市电动空中出租车首飞 纽约市正在体验未来空中旅行的预览,电动垂直起降(eVTOL)飞机的初步测试飞行已经开始。Joby Aviation本周完成了首次点对点eVTOL飞行,从肯尼迪机场起飞,降落在曼哈顿西30街直升机场,仅用了15分钟——通常情况下,驾车需要一个多小时。 这些演示是FAA的eVTOL整合试点计划(eIPP)的一部分,将在未来10天内继续进行,利用全市的电动直升机场。Joby与达美航空和优步合作,旨在提供快速的机场接送和其他服务。竞争对手Archer Aviation也将于今年春天进行测试。 纽约和新泽西港务局正在积极为空中出租车服务做准备,寻求合作伙伴在拉瓜迪亚机场建设一个专门的“垂直起降港”。这些飞机,例如Joby的S4,拥有安静的运行和安全功能,有可能彻底改变通勤和物流。更广泛的测试计划将在26个州进行,纽约、洛杉矶和迈阿密被确定为常规电动空中出租车飞行的潜在启动城市。
## TeX & LaTeX 的持久遗产
20世纪70年代,斯坦福大学教授唐纳德·克努斯面临一个令人沮丧的问题:他的出版物中数学符号的排版不一致。他对电子排版的质量下降感到不满,因此着手创建自己的解决方案——TeX,一个于1978年发布的数字排版程序。
TeX 允许作者使用标记语言精确控制格式,直接将意图编码到稿件中。重要的是,克努斯公开了源代码,从而促进了一个协作社区。虽然功能强大,但 TeX 的底层命令对于某些人来说证明具有挑战性。这促使莱斯利·兰波特开发了 LaTeX,它是在 TeX *之上* 构建的,更易于使用的宏包。
LaTeX 的易用性推动了它的广泛采用,成为科学和技术出版的标准。它的精确性、自动化能力和开源特性仍然非常宝贵。尽管现代桌面出版工具已经存在,但 TeX/LaTeX 仍然蓬勃发展,尤其是在准确表示复杂的公式和算法至关重要的情况下,仅开放档案每月处理超过 10,000 份稿件。持续的开发,包括支持现代字体和 Unicode 的引擎,确保了它在未来几代人的相关性。
## Repo Caveman 插件:压缩基准测试
最近的一项基准测试对比了旨在压缩 Claude 响应的 Repo Caveman 插件与简单的“简洁明了”提示词以及 Claude 的默认设置。该研究使用严格的评分标准,评估了在六个类别中的表现:错误诊断、概念解释、架构权衡、多步骤设置、安全/破坏性操作以及错误解释,以评估质量和关键信息保留情况。
结果表明,Caveman 在整体 token 减少或质量方面并未始终优于“简洁明了”。虽然“简洁明了”实现了 34% 的 token 减少,但 Caveman 的“轻量”和“完整”模式与之相当。然而,Caveman 的“极致”模式,尽管旨在实现最大压缩,有时由于内置的“自动清晰化”功能而*增加了* token 数量。此功能有意放宽对安全关键指令(如安全警告或多步骤设置)的压缩,以确保清晰度。
最终,Caveman 的价值不仅仅在于压缩。它通过自动规则重新注入提供**一致的输出结构**和**跨会话的持久性**——这些是简单提示词所不具备的。虽然一个双词提示词可以在 token 数量和质量上与 Caveman 相匹配,但 Caveman 提供了更多的控制和可预测性,使其对于需要结构化 Claude 输出的应用来说很有价值。基准测试代码是开源的,可供进一步测试。
## Vera:一种为LLM驱动编程设计的语言
Vera是一种新的编程语言,专门为大型语言模型(LLM)编写代码而设计。它编译为WebAssembly,旨在解决LLM在代码连贯性和可扩展性方面面临的挑战——特别是源于命名和维护不变式的问题。
与传统语言不同,Vera消除了变量名,而是使用结构化引用(@Int.0,@Int.1)。它*强制*使用显式契约(前置条件和后置条件)和效应声明,编译器会对这些进行静态验证,确保代码的正确性和可预测性。这种“可验证”的方法将重点从模型“正确”转移到“可验证”。
主要特性包括默认纯函数设计、代数效应用于管理副作用(如I/O和LLM调用)以及强大的类型系统。Vera提供详细且对模型友好的错误消息,引导LLM进行修复。
目前版本为v0.0.127,Vera包含一个参考编译器、全面的文档(SKILL.md针对LLM代理)和一个基准测试(VeraBench),展示了与Python和TypeScript相比,LLM在使用Vera时的竞争性能。它正在积极开发中,路线图侧重于构建用于经过验证的工具集成工具。