尽管人工智能在编程任务上已变得非常出色,但认为它会取代人类开发人员是一个错误。我们不应将人工智能视为一种自主的替代品,而应将其视为一种能够增强现有专业能力的工具——就像钢铁侠的战甲一样。
作者指出了一种明显的差异:技术精湛的开发人员利用深厚的技术知识引导模型,从而实现巨大的生产力提升。相反,缺乏基础专业知识的人往往会陷入困境,因为他们无法引导人工智能去实现整体性的架构解决方案。常见的错误是将本应归功于用户专业水平的结果,错误地归功于工具本身。
归根结底,人工智能并没有消除对人类技能的需求,反而提高了拥有深厚领域知识的人所能达到的上限。由于人工智能的效果取决于使用者,因此持续积累深厚的技术专业知识仍然至关重要。为了帮助开发人员磨练这些技能,作者推出了一门关于“天马行空的动画”(Whimsical Animations)的新课程,旨在弥合复杂的工程概念与实际网页开发之间的差距。
此基准测试评估了六款 AI 编码工具使用 OpenSCAD 构建 3D 万神殿模型的能力。选择 OpenSCAD 是因为它基于文本且具有参数化特性,这使得大语言模型(LLM)能够通过代码(如用于圆柱的循环或用于圆顶的布尔运算)来推演几何结构,而无需操作复杂的 3D 软件界面。
**主要发现:**
* **工具与判断力:** 所有智能体均能成功对接 OpenSCAD 命令行界面以进行渲染和预览迭代。瓶颈不在于技术接口,而在于几何判断力和空间推理能力。
* **性能表现:** 响应速度较快的模型(如 Cursor)往往表现最差,而响应较慢、更谨慎的模型(如 Gemini 3.5 Flash High)通过结合真实尺寸和复杂的建筑细节(如方格天花板),取得了最高的质量。
* **人在回路(Human-in-the-Loop):** 虽然全自动生成技术正在进步,但对于复杂的 CAD 任务,通过人工对渲染图进行标注来提供视觉反馈的“ModelRift”工作流程,仍优于纯文本指令。
* **可靠性:** 预览渲染与最终 STL 导出之间的差距仍然是一个长期存在的问题,这表明开发循环中的视觉保真度并不能保证生成整洁、可打印的网格模型。
总体而言,虽然目前没有任何模型能实现完美的建筑重建,但自动参数化设计的基准水平正在显著提升。