MemeData

当人工智能实现自我构建：我们迈向递归自我改进的进程 When AI Builds Itself: Our progress toward recursive self-improvement 30 天前

Anthropic 的报告指出，人工智能的开发正越来越多地交由 AI 系统自身完成，这显著加快了进展速度。内部数据显示，Anthropic 工程师现在的代码交付量是 2021-2025 年间的八倍，这主要得益于 AI 智能体目前已能自主执行复杂任务。这一趋势指向了“递归自我改进”，即 AI 系统获得设计和开发自身继任者的能力。虽然这可能在科学和医疗领域带来突破，但也引发了关于人类控制和安全的关键风险。随着 AI 系统自主性增强，进展的瓶颈正从代码编写和实验转向人类主导的研究判断与监督。 Anthropic 警告称，如果这种趋势持续下去，AI 可能很快会在研究设计方面超越人类能力。由于该技术的发展速度超出了大多数机构的应对准备，Anthropic 主张进行全球协调，以便在必要时实现暂停或减速。他们认为，建立可验证的国际安全与监督机制至关重要，以确保在 AI 自主构建的过程中，人类仍能有效地监控并保障这些系统的安全。

Anthropic 关于“递归自我改进”的文章在 Hacker News 上引发了激烈讨论，焦点主要集中在对其预期 IPO 前动机的质疑上。批评者认为，这篇文章是旨在推高估值的“营销噱头”，而非对技术突破的透明探讨。评论主要围绕三个主题： 1. **对“生产力”指标的质疑**：Anthropic 声称代码交付量提升了 8 倍，这遭到了广泛批评。评论者指出，“代码行数”（LOC）并非衡量进展的好指标，AI 模型往往会生成“臃肿”或难以维护的代码，代码量的增加并不等同于工程质量的提升。 2. **基础设施与质量问题**：许多用户对 Anthropic 工具的现状感到不满，指出其“Claude Code”应用程序资源占用大、漏洞多，且容易发生服务器宕机，这与其宣扬的革命性、自我改进系统的叙事相冲突。 3. **“监管俘获”假说**：怀疑论者担心，Anthropic 呼吁对前沿 AI 开发进行“暂停”或监管减速，是一种旨在建立高准入门槛的战略举措，意在形成垄断，以抑制来自开源项目和小实验室的竞争。尽管一些用户表示个人生产力有所提升，但舆论共识倾向于对该公司所描绘的生存叙事持深刻怀疑态度。

和积、单位距离与数域 Sum-product, unit distances, and number fields 30 天前

在这篇文章中，托马斯·布鲁姆（Thomas Bloom）探讨了近期针对**和积猜想（sum-product conjecture）**和**单位距离猜想（unit distance conjecture）**的反例证明。这两项突破都利用了类似的“张量幂”策略：即先找出一个能提供微小常数改进的简单构造，再通过使用次数不断增加的数域（$d \to \infty$）将其扩展到更高维度。其核心技术依赖于**代数数论**，特别是数域 $K$ 的性质。通过利用整数环 $\mathcal{O}_K$ 和单位群 $\mathcal{O}_K^\times$，研究人员在高维空间中构建了表现类似于算术级数和几何级数的集合。该方法的一个关键要求是存在数域的“塔”，其中判别式和调节子保持在 $O(1)^d$ 的界限内，而**戈洛德-沙法列维奇定理（Golod-Shafarevich theorem）**满足这一条件。布鲁姆指出，尽管这些技术在理论上几十年前就已具备，但由于研究人员往往追求更深层、更复杂的联系，它们一直被忽略。他反思了人工智能驱动的发现与人类研究之间的差异，并指出人工智能能够不懈地遍历文献并剔除“失败”路径，从而找到了这些反例；而人类研究则往往倾向于追求简化以及偶然的、独立的发现。

抱歉。

Zettascale (YC S24) 正在招聘创始 FPGA 工程师 Zettascale (YC S24) Is Hiring Founding FPGA Engineers 30 天前

Zetta 是一家雄心勃勃的初创公司，致力于通过开发用于驱动 AGI（通用人工智能）和 ASI（超级人工智能）的先进 XPU 芯片，成为下一个 NVIDIA。我们正在寻找一位硬核技术大牛加入我们在旧金山的创始团队，共同构建 AI 计算的未来。 **核心要求：** * **核心专长：** 对数字设计（VLSI、RTL、微架构）以及综合/时序收敛有深厚的专业知识。 * **技术能力：** 具备前端工具链（VCS/Genus）、脚本编写（Python、Tcl、Nix）及优化 PPA（功耗、性能、面积）的经验。 * **领域重点：** 在 GPU、CPU 或 AI 加速器的计算数据通路和内存子系统设计方面拥有成熟的背景。 * **思维方式：** 沉浸式、具备自学能力的博学之才，准备好在软硬件边界攻克近乎不可能的工程挑战。 **加分项：** 具有高速接口（PCIe、HBM）、可测试性设计（DFT）意识的 RTL、可复用 IP 设计以及系统级编程经验者优先。 **加入我们：** 您将在一家具有变革意义的公司中担任基石角色，并与顶尖工程师直接共事。我们提供具有竞争力的薪酬、可观的股权，以及参与“毕生之作”的机会，该项目旨在影响未来数代的技术发展。

抱歉。

复古科技育儿 Retro-Tech Parenting 30 天前

作为一名技术人员和家长，我对现代数字平台那种具有操纵性且“追求参与度”的本质持谨慎态度。虽然我希望孩子们能体验科技带来的丰富魅力，但我不希望让他们暴露在当前基于监控的生态系统中。为了在确保孩子安全与独立的同时重新获得科技的益处，我转向了“复古”解决方案。通过使用 CD 和 DVD 等物理媒介，我能够掌控内容，并让孩子们在没有算法干扰的情况下自由地探索音乐和电影。同样，我安装了一部专门的座机，让他们在没有智能手机风险的前提下，能够独立管理自己的社交联络，比如给祖父母打电话。最后，我设置了一台受限的家庭电脑，并配置了仅限白名单的网页过滤器，让孩子们可以在一个安全、经过筛选的数字空间中享受教育资源和游戏。尽管这些解决方案比主流科技需要付出更多的努力，但这种权衡是非常值得的。通过摒弃现代掠夺性系统的便利，转而采用更具意图性、往往更为老派的技术，我得以按照我们自己的方式与孩子们分享数字世界的奇妙。

这次讨论的主题是“复古科技育儿”，这是科技圈家长中日益兴起的一种趋势。他们倾向于使用老式、非算法驱动的设备，以保护孩子免受现代联网设备成瘾性的影响。参与者分享了培养健康科技习惯的策略，例如： * **离线硬件：** 使用“哑设备”，如固定电话（通常通过VoIP）、CD播放器和经典游戏机。这些设备不具备诱导点击、数据追踪或算法信息流。 * **实体媒介：** 强调黑胶唱片、录像带和纸质书等触觉体验，以培养孩子的拥有感与耐心。 * **受控访问：** 实施严格的家长控制，使用受监督的家庭电脑，并推迟到高中才允许孩子拥有智能手机。其主要动机并非单纯的怀旧，而是希望优先选择“服务于用户”的工具，而非“支配用户”的媒体。虽然许多人认为这对于心理健康至关重要，但也有人担心这种限制会导致社交孤立，因为孩子们可能难以与依赖现代通讯和社交媒体的同龄人进行交流。归根结底，大多数参与者认为核心挑战不在于科技本身，而是如何在一个被数字“糟粕”主导的世界里，引导孩子养成健康的习惯。

谷歌因其引发争议而解雇蒂姆尼特·格布鲁（Timnit Gebru），如今这些针对大语言模型的警告已全部应验。 The LLM warnings Google fired Timnit Gebru over have all come true 30 天前

2020年，谷歌解雇了其人工智能伦理团队的领导者蒂姆尼特·格布鲁（Timnit Gebru）博士，原因在于她拒绝撤回其研究论文《论随机鹦鹉的危险性》（On the Dangers of Stochastic Parrots）。这篇与埃米莉·本德（Emily Bender）等人合著的论文，概述了大型语言模型（LLM）的五大关键风险，而这些风险后来被证明具有惊人的预见性。格布鲁警告称，模型的规模化将导致其成为无法真正理解含义的“随机鹦鹉”，从而产生广泛的“幻觉”现象。她预测，训练数据的偏差将固化招聘、医疗和金融领域的歧视，这一现象如今已得到大量记录。此外，她还强调了巨大的环境成本、大规模数据集无法审计（导致有害内容扩散）的问题，以及可能削弱语言多样性的文化权力集中化风险。谷歌解雇格布鲁并解散其团队的决定，有效地压制了内部异见，在研究人员中制造了一种恐惧文化。尽管科技巨头无视她的警告，执意追求快速发展，但随后的行业危机——从模型崩溃到破纪录的碳排放——都印证了她的研究。格布鲁被解雇一事是一个鲜明的例证，表明企业激励机制如何将利润置于安全与伦理考量之上，而后者对于人工智能的负责任发展至关重要。

近期 Hacker News 上的一场讨论围绕 Timnit Gebru 2021 年发表的“随机鹦鹉”（Stochastic Parrots）论文及其遗产展开，探讨了她对大语言模型（LLM）的警告是否已成现实。该论文最初针对以下风险提出了警告： 1. **规模：** 只有流畅度而无实际理解能力。 2. **偏见：** 系统性地放大社会偏见。 3. **环境：** 训练模型所需的高昂能源成本。 4. **文档记录：** 海量数据集导致审计变得不可能。 5. **中心化：** 技术巨头对权力的垄断。参与讨论者对此意见分歧严重。批评者认为该论文已过时，指出现代大语言模型展现出的推理和解决问题能力，已经超越了“随机鹦鹉”的标签。而另一派则认为，尽管关于什么是“理解”仍有争议，但偏见、幻觉和中心化等负面影响已显而易见。讨论帖还反映出人们对原始争议的定性持怀疑态度，一些用户质疑 Gebru 究竟是“被解雇”还是“辞职”，另一些用户则认为所提供的原始来源是低质量的标题党内容。归根结底，这场讨论反映了科技界内部持续存在的紧张关系：即人工智能安全问题究竟是合理的警示，还是被夸大且流于形式的批判。

现在是成为胶带工程师的最佳时机 Now Is the Best Time to Be a Duct Tape Engineer 30 天前

请启用 JavaScript 和 Cookie 以继续。

抱歉。

谷歌员工在内部分享关于其人工智能有多烂的梗图 Google Employees Internally Share Memes About How Its AI Sucks 30 天前

尽管谷歌首席执行官桑达尔·皮查伊（Sundar Pichai）强调公司75%的新代码是由人工智能生成的，但内部员工的看法却大相径庭。据《404 Media》报道，谷歌员工在公司内部留言板Memegen上大量发布“反人工智能”的表情包。这些数量成百上千的表情包反映了员工对AI工具（特别是“Jetski”）的不满，他们认为这些工具会产出不准确的报告、产生虚假信息（幻觉）以及生成低质量的代码。员工们认为，虽然人工智能增加了代码的数量，但却给必须筛选这些“垃圾内容”的人工审核员造成了严重的瓶颈。除了技术上的挫败感，员工还表示，由于公司不断将重心转向人工智能项目，牺牲了其他必要任务，导致他们感到精疲力竭。一些员工称，强制使用人工智能的做法流于形式，因为无论是否使用AI，最终仍需人工干预才能完成工作。对此，谷歌回应称，公司非常重视工程师提供的这些“坦诚反馈”，并将其视为改进内部工具的重要组成部分。然而，谷歌随后修改了这一声明，删除了关于“人在回路（humans in the loop）”的具体表述，这一举动引发了外界对其推进人工智能整合进程的进一步关注。

Show HN: Boxes.dev：放弃本地运行；在云端运行 Claude Code 和 Codex Show HN: Boxes.dev: ditch localhost; run Claude Code and Codex in the cloud 30 天前

您没有提供需要翻译的内容。请提供您想要翻译的文字。

抱歉。

波音787在法兰克福发生前起落架坍塌，多人受伤。 Several Injured in Boeing 787 Nose-Gear Collapse in Frankfurt 30 天前

请启用 JavaScript 并关闭所有广告拦截器

抱歉。

KVarN：华为原生 vLLM KV Cache 量化后端 KVarN: Native vLLM backend for KV-cache quantization by Huawei 30 天前

**KVarN** 是专为 vLLM 设计的高性能 KV 缓存量化解决方案，旨在克服容量、速度和准确性之间传统的权衡问题。与现有的牺牲吞吐量或精度来换取缓存容量的方法不同，KVarN 在保持 FP16 级准确性的同时，相比 FP16 实现了约 3–5 倍的容量提升，且吞吐量相当甚至更高。它通过一种新颖的“方差归一化”处理来实现这一点，该过程利用 Hadamard 旋转和迭代归一化，在低位舍入前将量化误差降至最低。 **主要功能：** * **即插即用：** 作为原生 vLLM 注意力后端运行。无需更改模型或进行校准，只需通过单个标志（`--kv-cache-dtype kvarn_k4v2_g128`）即可启用。 * **高性能：** 始终位于性能指标的“右上角”——在提供更长上下文的同时，同步实现更高的并发请求容量和改进的吞吐量。 * **部署便捷：** 可作为 vLLM 的分支轻松安装，支持标准的服务工作流程。 KVarN 基于 Apache 2.0 许可证发布，是论文《KVarN: Variance-Normalized KV-Cache Quantization Mitigates Error Accumulation in Reasoning Tasks》的官方实现。对于需要在不妥协质量或速度的前提下进行长上下文推理的生产工作负载，它是理想的解决方案。

抱歉。

每日HackerNews RSS