请启用 JavaScript 并禁用任何广告拦截器。
请启用 JavaScript 并禁用任何广告拦截器。
该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。
谷歌已开源**Sashiko**,这是一款基于人工智能的代码审查系统,专为Linux内核设计。Sashiko 使用谷歌的 Gemini 3.1 Pro 开发(但兼容 Claude 等其他 LLM),此前已在内部使用,现在正在审查发送到 Linux 内核邮件列表的*所有*提交。
初步测试表明,Sashiko 识别了最近内核问题中带有“Fixes:”标签的约 **53% 的错误**——重要的是,这些错误是**人工审查员遗漏的**。虽然并非完美,但这表明了显著提高代码质量的潜力。
谷歌正在资助 Sashiko 的运营和基础设施,项目托管正在过渡到 Linux 基金会。代码可在 GitHub 上找到,补丁审查的网页界面位于 [Sashiko.dev](https://sashiko.dev)。这标志着人工智能代理集成到开源内核开发的关键流程中的一步。
## 黑客新闻数据集:完整档案 该数据集提供自2006年成立以来,黑客新闻(HN)提交的每一项内容的完整、实时更新档案,截至2026年3月,总计超过4700万项内容。HN由Y Combinator维护,是技术人员和企业家们的重要在线社区。 数据来源于镜像HN Firebase API的ClickHouse Playground,组织成每月Parquet文件,并对当前日期进行5分钟实时更新。它包括故事、评论、投票、招聘信息和用户数据(用户名),允许对趋势、讨论和社区动态进行深入分析。 **主要特点:** * **完整且更新:** 每5分钟持续更新,确保接近实时的数据。 * **高效格式:** 存储为Parquet格式,方便使用DuckDB和`datasets`库进行快速查询。 * **详细数据:** 包括项目ID、类型、作者、时间戳、文本、评分、URL和后代计数。 * **易于访问:** 在Hugging Face上提供,方便下载和使用。 **潜在用途:** 语言模型训练、情感分析、社区研究和信息检索。 该数据集采用开放数据共享许可协议(Open Data Commons Attribution License)。更多详细信息,包括数据模式和使用示例,可在Hugging Face数据集页面上找到。
最近政府的倒退表明,版权所有者在与寻求在未经许可的情况下将受版权保护的材料用于人工智能训练的技术公司之间的斗争中取得了胜利。剑桥大学出版社的曼迪·希尔赞扬了这一决定,重申了现有法律:对此类用途*需要*获得许可。 然而,政府并未完全关闭未来例外情况的大门,引发了持续的争论。Tech UK认为,清晰的框架对于英国在全球人工智能竞赛中保持竞争力至关重要,担心落后于国际竞争对手。 这场争议源于人们对人工智能开发依赖于“免费”获取创意内容,可能损害艺术家和创作者的担忧——像埃尔顿·约翰爵士这样的人物对此进行了激情的辩论,他将此比作盗窃。虽然去年对《数据(使用和访问)法案》的一项寻求人工智能训练数据的透明度的修正案被否决,但这个问题仍然未解决,并且是一个主要的争议点。
## 朝鲜IT工人计划:日益增长的威胁 IBM X-Force和Flare Research的最新报告详细介绍了朝鲜渗透公司、使用虚假IT工人背后复杂的运作。这些工人可能遍布40个国家,总数高达10万,每年为平壤带来约5亿美元的收入,他们通过远程和全职职位窃取资金和敏感数据。 该运作涉及分层结构:招聘人员、协助者、IT工人以及合作者(提供身份的西方人)。工人们擅长网页开发和.NET,通常不知道计划的真实性质,最初被告知他们加入的是“隐秘的初创公司”,例如“C Digital LLC”。他们使用虚假的在线资料和工具,如谷歌翻译、朝鲜VPN(OConnect/NetKey)以及安全消息应用程序IPMsg。 研究人员发现证据表明工人们在Upwork等自由职业平台上追踪“投标”和“消息”。一旦受雇,他们便利用协作支持来取得成功并获得系统访问权限。缓解策略包括仔细审查在线面试行为中的不一致之处,留意人工智能修改过的视觉内容,并使用“致命问题”——直接询问关于金正恩的问题,朝鲜工人会立即结束通话以避免回答。
## 规范化日志:摘要 传统的日志记录方式常常将关键信息分散在多行中,阻碍了高效的故障诊断。Stripe的解决方案——现在被称为“宽事件”或“规范化日志行”——提倡为每个工作单元(通常是一个请求)发出一个*单一*的、结构化的记录,其中包含所有重要字段。 这包括诸如路由、方法、状态、持续时间、用户ID、构建/部署ID、功能标志,以及关键的、用于特定失败原因的稳定`error_slug`。这种预连接的数据允许直接查询完整的请求,而不是手动重建。 好处不仅在于改进了调试,还在于能够进行强大的分析,用于发布影响、客户支持和产品洞察。除了基本信息外,需要记录的关键字段包括路由*模板*(例如`/users/{user_id}`)、发布元数据(构建ID)、执行成本(数据库时间)和决策输入(功能标志)。 虽然像用户ID这样高基数度的字段可以通过适当的存储(如ClickHouse或BigQuery)来管理,但核心原则是*先*记录,然后聚合——保留上下文以进行更深入的关联,并回答关于系统行为的复杂问题。稳定的模式和一致的发出,即使在发生故障时,对于成功至关重要。
启用 JavaScript 和 Cookie 以继续。
与火箭爱好者交流,提问关于火箭设计的问题,分享你的经验,并与我们的开发者联系。 我们的Discord服务器是讨论、学习和与志同道合的人一起享受乐趣的理想场所。 点击下面的按钮加入:加入我们的Discord服务器
## NVIDIA NemoClaw:运行安全、始终在线的助手
NVIDIA NemoClaw 是一个开源堆栈,旨在简化和保护使用 OpenClaw 部署始终在线的助手。它利用 NVIDIA Agent Toolkit 的 OpenShell 运行时为代理创建隔离、沙盒化的环境,并通过 NVIDIA 云服务进行推理。
目前处于早期 alpha 阶段,NemoClaw 提供了快速设置本地环境的工具,但尚未达到生产就绪状态,并且可能会发生变化。它需要 Ubuntu 22.04+、Node.js 20+、npm 10+ 和 Docker,推荐配置为 16GB 内存和 40GB 磁盘空间。
NemoClaw 的核心是“蓝图”系统,它协调沙盒创建、安全策略(网络、文件系统、进程控制、推理路由)和模型访问。一个 CLI (`nemoclaw`) 管理堆栈,而一个交互式 TUI 允许监控和批准网络请求。
NemoClaw 目前支持 `nvidia/nemotron-3-super-120b-a12b` 模型,需要 NVIDIA API 密钥才能访问。该项目欢迎社区反馈和贡献,并随着发展不断完善。