每日HackerNews RSS

现代人工智能这一万亿美元产业由大语言模型(LLM)驱动,其根基建立在 1991 年慕尼黑工业大学的一段“奇迹”时期。在尤尔根·施密德胡贝(Jürgen Schmidhuber)的领导下,他的团队在短短几个月内发表了定义当代人工智能的核心架构创新。 1991 年该实验室的关键贡献包括: * **Transformer:** ChatGPT 中的“T”,源于首个非归一化线性 Transformer。 * **预训练(Pre-training):** ChatGPT 中的“P”,为深度神经网络学习奠定了基础。 * **神经网络蒸馏(Neural Network Distillation):** 深度求索(DeepSeek)等现代系统的一项核心技术。 * **深度残差学习(Deep Residual Learning):** LSTM 和 ResNet 的基础,至今仍是历史上被引用次数最多的人工智能研究论文之一。 * **生成式人工智能:** 生成对抗网络(GAN)和循环世界模型的早期研究基础。 尽管商业人工智能的中心此后已转移至太平洋沿岸,但这些 1991 年的突破仍是全球人工智能版图的支柱。正如研究员大卫·哈(David Ha)所指出的,这些概念经受住了时间的考验,证明了当今生成式人工智能时代的本质种子早在三十多年前就已经播下。

由于 Codex 的 SQLite 反馈日志机制,该程序正导致 SSD 出现过度的写入损耗。目前该应用程序默认将所有目标的日志级别设为 `Level::TRACE`,导致每年产生约 640 TB 的写入量——这足以在不到 12 个月内耗尽一块标准 1 TB SSD 的寿命额定值。 日志中充斥着来自内部依赖项(如 `inotify` 事件、`tokio-tungstenite` 内部组件)的高频冗余信息以及重复的 OpenTelemetry 事件。由于系统持续进行插入并立即清理数据的操作,底层数据库承受着严重的写入放大。 **拟议解决方案:** * **限制日志级别:** 取消 SQLite 接收端全局 `TRACE` 的默认设置,并提高高频、低价值目标的日志阈值。 * **优化数据:** 用汇总的遥测数据(如持续时间、成功状态、令牌使用量)代替原始的 Websocket/SSE 有效负载日志。 * **限制遥测:** 除非调试需要,否则停止持久化存储镜像的 `codex_otel` 事件。 * **实施上限:** 引入全局数据库大小或写入量限制,以防止日志失控。 * **配置项:** 提供一个明确的“出口”,允许根据需要完全禁用反馈日志记录。

OpenAI “Codex” 应用中的一个关键漏洞在 Hacker News 上引发了激烈讨论。用户反馈称,该软件会在闲置时生成海量的日志数据,甚至可能向本地 SSD 写入数 TB 的内容。 这一事件加剧了公众对“感觉编程”(vibe coding,即在缺乏人工监管的情况下依赖 AI 编写和管理代码)的普遍不满。批评者认为,此次故障凸显了现代 AI 驱动开发工具在质量保证和责任归属方面的缺失。许多用户指出,虽然这类错误在人类编写的代码中并不罕见,但当这些问题出现在标榜为专业级解决方案的“前沿”AI 实验室产品中时,则显得尤为令人担忧。 讨论还涉及了更广泛的系统性问题: * **性能臃肿:** 用户反馈称,OpenAI 的 Codex 和 Anthropic 的 Claude Code 都存在 GPU/CPU 高占用及内存泄漏问题,这通常被归因于效率低下的 Electron 架构或过多的后台进程。 * **对“感觉编程”的批评:** 怀疑论者认为,在没有严格人工审查和正式质量保证的情况下将复杂任务委派给 AI,必然会导致软件不稳定且臃肿。 * **责任归属:** 用户争论开发者是否应对“粗制滥造”(slopware)的缺陷负责,特别是在公司优先考虑快速迭代而非稳定性的情况下。 尽管 OpenAI 已经发布了补丁,但用户对 AI 自动化开发的可靠性仍存在分歧。

开源模型 **GLM-5.2** 的发布是一个重要的里程碑,这促使人们将其与闭源行业领头羊 **Claude Opus 4.8** 进行直接对比。 在一项严苛的测试中——从零开始利用原始 WebGL 构建一款 3D 平台跳跃游戏——两款模型展现了各自明显的优势: * **Claude Opus 4.8** 在处理高风险、重视觉的任务时依然是更优选择。它的速度更快,生成的代码更精炼,并能成功利用其多模态能力“观察”并修复视觉错误。 * **GLM-5.2** 是一个强有力的替代方案,特别是考虑到它采用 MIT 许可协议,且成本显著更低(约为 Opus 的五分之一)。虽然它在视觉自我修正方面稍显吃力,导致了诸如纹理缺失等细微错误,但在处理复杂的长序列编程任务时表现出极强的能力。 **结论:** GLM-5.2 是迄今为止最强大的开源权重模型,使其成为文本逻辑和编程领域必不可少的经济型工具。然而,对于需要视觉判断和极致完善的项目,Claude Opus 仍然是首选标准,尽管价格更高。GLM-5.2 的主要优势在于其永久性;作为一款开源权重模型,它为开发者提供了一个可靠且独立于供应商的基础,不会受到限制或下架的影响。

本项目完全使用 Rust 的类型系统实现了一个 Lisp 解释器。通过利用 trait,它能够在编译期完成表达式求值。 **核心特性与限制:** * **编译期执行:** 表达式在编译阶段求值,结果通过类型级断言进行验证。 * **作用域与控制:** 支持全局和词法环境(通过 `let`)、递归函数,以及用于高级流程控制的 `call/ec`(逃逸续延)。 * **手动配置:** 必须使用 `defkey!` 宏显式声明符号。 * **局限性:** * **数值限制:** 整数限制在 [0, 8192] 范围内。虽然可以通过 `build.rs` 进行扩展,但这样做需要增加 Rust 的栈大小。 * **缺失功能:** 不支持 `defmacro` 或运行时 `eval` 功能。 * **实验性质:** 该系统尚未经过广泛测试。 简而言之,本项目通过在构建过程中使用 Rust 的 trait 系统来执行复杂的 Lisp 程序(如所提供的阶乘和续延示例),展示了 Rust 类型系统的图灵完备性。

从 Deno v2.9.0 开始,**deno desktop** 允许开发者将任何 Deno 项目(从简单的脚本到 Next.js 或 Astro 等复杂的 Web 框架)打包为独立、可分发的桌面应用程序。 与 Electron 或 Tauri 等现有解决方案不同,*deno desktop* 专注于减小二进制文件体积、提供完整的 Node.js 兼容性以及无缝的开发体验。其主要功能包括: * **框架无关性:** 自动检测主流 Web 框架,无需修改代码。 * **高性能:** 使用进程内绑定(in-process bindings)代替 IPC,实现更快的后端到 UI 通信。 * **内置工具:** 提供跨平台编译、原生系统集成(菜单、托盘、通知、对话框)以及稳健的二进制差分自动更新系统。 * **灵活的后端:** 默认使用操作系统原生 WebView 以获得紧凑的二进制体积,并提供可选的集成 Chromium (CEF) 后端以实现一致的跨平台渲染。 *deno desktop* 目前可在 canary 版本中使用,它通过利用 Deno 运行时和通用的 Web 生态系统简化了桌面开发。虽然 API 在正式发布前可能会有所变动,但它为构建现代跨平台应用程序提供了一个强大且具有独特见解的替代方案。

请启用 JavaScript 和 Cookie 以继续。

抱歉。

一位丹麦隐私活动人士兼前警官报告称,他遭到蒙面武装警察的突袭逮捕,对方在未发警告的情况下闯入其家中。该活动人士认为,此次突袭是对他公开丹麦首相私人联系方式,以及批评其支持大规模监控和反加密政策的报复。 据该活动人士所述,警察在行动时立即切断了他的路由器电源,并没收了他的谷歌 Nest 摄像头,以防他们的行动被录下。尽管该活动人士设法拍摄了对峙初期的视频,但由于警察没收了他的设备,目前这些影像已无法访问。他强调,根据丹麦法律,拍摄警察是合法的。他认为警察试图销毁潜在视频证据的行为,以及在逮捕过程中拒绝告知指控罪名,都是非法的。该活动人士对公民自由状况表示深切担忧,并警告称丹麦和西方国家正趋向威权主义,隐私权也在不断衰退。

跳至主要内容 更多简报 第一民族倡导支持由原住民领导的人工智能基础设施 保守党内部人士开始游说艾伯塔省的可再生能源项目 滑雪学校希望在艾伯塔省采用永久夏令时之前进行全民公投 荷兰投资巨头希望投资加拿大房地产 数据库 西海岸问责制 采购 默认公开 政治捐赠者 探索所有 文章 政治 游说 经济 气候 权力与影响 探索所有 关于 关于 IJF 团队 合作者 职业机会 联系我们 资源 商店 为我们撰稿 向我们爆料 我们的资助者 我们的支出 其他资源 政策 退货与退款 编辑政策 隐私政策 人工智能政策 服务条款 Cookie 偏好 订阅即可获取 IJF 屡获殊荣的新闻报道,直接发送至您的收件箱。 © 2026 调查新闻基金会 (Investigative Journalism Foundation)。保留所有权利。

抱歉。

以下是《现代 64 位 CPU 高效 C++ 编程》第四章的总结,重点介绍了常见操作在 CPU 周期上的性能成本: * **算术运算:** 基本整数运算成本较低(1–2 个周期),但除法依然“极其昂贵”(10–28 个周期)。乘法成本适中(3–5 个周期)。 * **C++ 抽象:** 异常在不被触发时效率很高,但一旦触发则会消耗数千个周期。与虚函数调用相比,RTTI 和 `dynamic_cast` 的开销显著更高。 * **函数调用:** 直接调用成本约为 15–30 个周期,而间接/虚函数调用成本为 20–60 个周期。内联至关重要,它不仅能消除调用开销,还能启用更广泛的编译器优化,从而节省数十个周期。 * **并发:** 原子/CAS 操作在本地成本约为 15 个周期,但在多插槽(multi-socket)系统中可能达到 300–600 个周期。线程上下文切换开销极其巨大(10,000–100,000+ 个周期),这主要归因于缓存失效等间接成本。 * **其他:** 由于指针间接寻址,访问 `thread_local` 变量会引入额外的开销。 作者强调,虽然这些数据为优化提供了一个实用的参考框架,但它们只是估算值,会因架构和上下文的不同而有所差异。

抱歉。

请启用 JavaScript 和 Cookie 以继续。

抱歉。

更多

联系我们 contact @ memedata.com