现代人工智能这一万亿美元产业由大语言模型(LLM)驱动,其根基建立在 1991 年慕尼黑工业大学的一段“奇迹”时期。在尤尔根·施密德胡贝(Jürgen Schmidhuber)的领导下,他的团队在短短几个月内发表了定义当代人工智能的核心架构创新。
1991 年该实验室的关键贡献包括:
* **Transformer:** ChatGPT 中的“T”,源于首个非归一化线性 Transformer。
* **预训练(Pre-training):** ChatGPT 中的“P”,为深度神经网络学习奠定了基础。
* **神经网络蒸馏(Neural Network Distillation):** 深度求索(DeepSeek)等现代系统的一项核心技术。
* **深度残差学习(Deep Residual Learning):** LSTM 和 ResNet 的基础,至今仍是历史上被引用次数最多的人工智能研究论文之一。
* **生成式人工智能:** 生成对抗网络(GAN)和循环世界模型的早期研究基础。
尽管商业人工智能的中心此后已转移至太平洋沿岸,但这些 1991 年的突破仍是全球人工智能版图的支柱。正如研究员大卫·哈(David Ha)所指出的,这些概念经受住了时间的考验,证明了当今生成式人工智能时代的本质种子早在三十多年前就已经播下。
开源模型 **GLM-5.2** 的发布是一个重要的里程碑,这促使人们将其与闭源行业领头羊 **Claude Opus 4.8** 进行直接对比。
在一项严苛的测试中——从零开始利用原始 WebGL 构建一款 3D 平台跳跃游戏——两款模型展现了各自明显的优势:
* **Claude Opus 4.8** 在处理高风险、重视觉的任务时依然是更优选择。它的速度更快,生成的代码更精炼,并能成功利用其多模态能力“观察”并修复视觉错误。
* **GLM-5.2** 是一个强有力的替代方案,特别是考虑到它采用 MIT 许可协议,且成本显著更低(约为 Opus 的五分之一)。虽然它在视觉自我修正方面稍显吃力,导致了诸如纹理缺失等细微错误,但在处理复杂的长序列编程任务时表现出极强的能力。
**结论:**
GLM-5.2 是迄今为止最强大的开源权重模型,使其成为文本逻辑和编程领域必不可少的经济型工具。然而,对于需要视觉判断和极致完善的项目,Claude Opus 仍然是首选标准,尽管价格更高。GLM-5.2 的主要优势在于其永久性;作为一款开源权重模型,它为开发者提供了一个可靠且独立于供应商的基础,不会受到限制或下架的影响。
跳至主要内容
更多简报
第一民族倡导支持由原住民领导的人工智能基础设施
保守党内部人士开始游说艾伯塔省的可再生能源项目
滑雪学校希望在艾伯塔省采用永久夏令时之前进行全民公投
荷兰投资巨头希望投资加拿大房地产
数据库
西海岸问责制
采购
默认公开
政治捐赠者
探索所有
文章
政治
游说
经济
气候
权力与影响
探索所有
关于
关于 IJF
团队
合作者
职业机会
联系我们
资源
商店
为我们撰稿
向我们爆料
我们的资助者
我们的支出
其他资源
政策
退货与退款
编辑政策
隐私政策
人工智能政策
服务条款
Cookie 偏好
订阅即可获取 IJF 屡获殊荣的新闻报道,直接发送至您的收件箱。
© 2026 调查新闻基金会 (Investigative Journalism Foundation)。保留所有权利。
以下是《现代 64 位 CPU 高效 C++ 编程》第四章的总结,重点介绍了常见操作在 CPU 周期上的性能成本:
* **算术运算:** 基本整数运算成本较低(1–2 个周期),但除法依然“极其昂贵”(10–28 个周期)。乘法成本适中(3–5 个周期)。
* **C++ 抽象:** 异常在不被触发时效率很高,但一旦触发则会消耗数千个周期。与虚函数调用相比,RTTI 和 `dynamic_cast` 的开销显著更高。
* **函数调用:** 直接调用成本约为 15–30 个周期,而间接/虚函数调用成本为 20–60 个周期。内联至关重要,它不仅能消除调用开销,还能启用更广泛的编译器优化,从而节省数十个周期。
* **并发:** 原子/CAS 操作在本地成本约为 15 个周期,但在多插槽(multi-socket)系统中可能达到 300–600 个周期。线程上下文切换开销极其巨大(10,000–100,000+ 个周期),这主要归因于缓存失效等间接成本。
* **其他:** 由于指针间接寻址,访问 `thread_local` 变量会引入额外的开销。
作者强调,虽然这些数据为优化提供了一个实用的参考框架,但它们只是估算值,会因架构和上下文的不同而有所差异。