## NemoClaw:英伟达的企业级AI代理平台 NemoClaw是英伟达即将推出的开源平台,旨在为企业带来安全且可扩展的AI代理。作为对OpenClaw快速增长——以及随后被OpenAI收购——的回应,NemoClaw为需要自主任务自动化的企业提供了一种可靠且可定制的替代方案。 与面向消费者的代理不同,NemoClaw优先考虑企业级安全性和隐私,内置了安全保障和数据治理工具。它与英伟达的NeMo框架和NIM微服务深度集成,以实现优化性能,但值得注意的是,它**硬件无关**,可在英伟达、AMD、Intel和其他处理器上运行。 主要功能包括通过开源访问进行深度定制、跨部门的任务自动化,以及与Salesforce、Cisco和Google等不断增长的合作伙伴生态系统集成。英伟达设想NemoClaw将作为“企业代理时代”的基础层,将其影响力从硬件扩展到AI软件领域。 NemoClaw计划在GTC 2026上正式发布,标志着向企业级生产AI代理的关键转变。
斯特凡·法特西斯的《未删减版》探讨了现代词典,特别是韦氏词典,令人惊讶的动态历史。法特西斯挑战了人们对词典是静态权威的认知,揭示了编辑们如何越来越多地根据人们实际使用语言的方式来制定定义,追踪从拼字游戏搜索到9/11事件和COVID-19疫情后查询激增等趋势。
本书详细描述了从规范性词典(旨在规定“正确”用法)到描述性词典的转变,反映了语言的演变。这种变化并非没有争议,1961年第三版因收录“ain’t”等词汇而引发的强烈反对就是一个例子。
法特西斯本人在韦氏词典内部的经历,试图用他偏好的术语来影响词条,突显了传统与当代用法之间持续存在的紧张关系。虽然质疑词典在数字时代的未来,但他最终证明了人类编辑在定义语言方面仍然具有持久的价值,这是人工智能目前无法复制的过程。尽管面临挑战,韦氏词典仍然是一个强大的机构,不断适应并记录英语语言不断变化的图景。
## AI 代码生成与实际用处:脱节
一项最新研究调查了 AI 生成代码的实际应用性,评估依据是 SWE-bench Verified 基准测试。研究人员请三个开源项目的活跃维护者审查 296 个 AI 生成的拉取请求 (PR),这些 PR 都*通过*了自动化的 SWE-bench 评分器。结果显示存在显著差距:大约一半的通过测试的 PR 将不会被人工维护者合并。
这种差异不一定代表 AI 能力的局限性,而是凸显了自动化测试与人工代码审查之间的区别。维护者要求修改是由于代码质量、对仓库标准的遵守或核心功能问题。将分数与人工编写的“黄金补丁”进行标准化对比显示,维护者合并率比 SWE-bench 分数低约 24 个百分点,且改进速度较慢。
该研究强调,基准测试分数可能会高估代理的实用性,如果未纳入人工反馈和迭代改进——这是人工开发者标准的流程。虽然基准测试对于比较模型很有价值,但将其直接转化为实际影响具有挑战性,需要谨慎。研究结果表明,需要更细致的评估方法来考虑人工工作流程的复杂性。