arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受了我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。
arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受了我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。
谷歌正在大幅增加对人工智能公司 Anthropic 的投资,承诺高达 400 亿美元。首笔 100 亿美元的投资将 Anthropic 的估值定为 3500 亿美元,后续还有高达 300 亿美元的投资取决于其表现。此前,Anthropic 最近发布了其最强大的人工智能模型 Mythos,专注于网络安全,但由于安全问题和高运营成本,目前访问权限有限。 此举凸显了人工智能开发至关重要的计算能力竞争激烈。Anthropic 与竞争对手 OpenAI 一样,正在积极 확보基础设施——最近与 CoreWeave 和亚马逊合作以获取数据中心容量和计算能力,预计未来可能花费高达 1000 亿美元。 重要的是,Anthropic 严重依赖谷歌云的张量处理单元 (TPU),这是 Nvidia 芯片的关键替代品。此次合作将为 Anthropic 提供未来五年内额外的 5 吉瓦 TPU 容量,巩固了谷歌在人工智能领域作为竞争者 *和* 重要供应商的双重角色。Anthropic 还在考虑首次公开募股 (IPO)。
## Rodecaster Duo 固件探索 去年,为了寻找游戏和工作期间无缝音频的解决方案,作者购买了Rodecaster Duo。对它的易用性印象深刻,出于习惯,他们开始研究它的固件更新流程。最初在Mac上的尝试表明,更新是一个简单的、未加密的、gzip压缩的tar包——令人惊讶的是,缺少签名检查。该设备具有双分区系统用于恢复,甚至默认启用了SSH,并预配置了公钥。 一次更新失败促使作者使用Wireshark和Windows上的USBPcap进行进一步调查,并借助Claude AI分析捕获的数据。这表明更新过程依赖于简单的HID命令('M'进入更新模式,'U'触发闪存)和将文件复制到挂载的磁盘。 利用这些知识,作者创建了自定义固件以启用密码身份验证并添加他们自己的SSH密钥,从而成功访问该设备。他们向RODE报告了默认SSH配置,但没有收到回复。总的来说,作者对Rodecaster Duo的开放性和易修改性感到惊喜,并将其突出显示为设计精良且令人愉悦的音频设备。
最近对Hacker News (HN) BigQuery数据集的分析显示,arXiv论文在该平台上的分享数量有所下降。arXiv帖子曾在2019年左右达到高峰,这主要得益于深度学习研究(在点赞最多的论文中占41%),但近几个月其出现频率显著降低。
目前(2023-2026年),大型语言模型 (LLM) 和人工智能占据主导地位,占HN上点赞最多的arXiv论文的59%。该分析还确定了来自2019年并持续具有影响力的“老”论文,包括关于MuZero、EfficientNet、XLNet、PyTorch以及Chollet的《关于智能的度量》等研究。
展望未来,Claude预测了一些潜在的未来有影响力的论文,例如DeepSeek-R1、Generative Agents、BitNet、Differential Transformer,甚至是有争议的LK-99超导体预印本,突显了LLM推理、代理架构和高效计算的持续趋势。这项研究表明,HN的关注点正在从更广泛的深度学习领域转向更具体的LLM领域。
启用 JavaScript 和 Cookie 以继续。
请启用 JavaScript 并禁用任何广告拦截器。
请启用 JavaScript 并禁用任何广告拦截器。
## cc-canary:Claude Code 模型漂移检测
cc-canary 是一款本地、注重隐私的工具,用于检测 Claude Code 模型的漂移。它分析您现有的 Claude Code 会话日志 (~/.claude/projects/),无需任何网络访问、账户或遥测数据。它被打包为两个可安装的 Agent Skills:`cc-canary`(Markdown 报告)和 `cc-canary-html`(交互式仪表盘)。
该工具生成法医报告,详细描述模型在指定时间窗口(7-180 天)内的行为,通过成本、读/写比例、推理循环和 token 使用量等指标突出潜在的回归。报告包括“判决”(HOLDING,SUSPECTED/CONFIRMED REGRESSION,INCONCLUSIVE)以及跨模型版本的详细比较。
cc-canary 通过聚合会话数据、检测模型健康状况的拐点,并预渲染报告,然后由 Claude 填充叙述性分析来工作。它需要 Python 3.8+,并且可以通过 `npx skills add delta-hq/cc-canary` 轻松安装。
目前处于预 Alpha(0.x)阶段,输出格式和指标可能会发生变化。更多信息和贡献请访问 [github.com/delta-hq/cc-canary/issues](https://github.com/delta-hq/cc-canary/issues)。
旧金山国际机场(SFO)正引领美国机场向“安静机场”发展的趋势,通过大幅减少噪音来优先考虑更平静的旅行体验。该项目始于2018年,并在疫情期间加速推进。SFO已将登机口广播减少了40%——仅国际航站楼每天就减少了超过90分钟的公共广播消息——并且现在正在处理自动扶梯噪音问题。
这种方法类似于阿姆斯特丹史基浦机场、新加坡樟宜机场和苏黎世机场的举措,侧重于本地化广播和最大限度地减少背景噪音,如音乐。倡导者强调这对于神经多样性旅客和对感官敏感的旅客的好处,同时也承认对视力障碍旅客的潜在担忧。
由于大多数旅客现在依赖数字更新,SFO认为广泛的广播通常是多余的。初步旅客反馈积极,引发了关于更多机场是否应该采用这种更宁静模式的讨论。
发布GPT-5.5,一款用于复杂专业工作的新前沿模型,已应用于对话补全和响应API。同时,发布GPT-5.5 Pro用于响应API请求,包括通过批量处理,以解决更困难、需要更多计算的问题。GPT-5.5支持100万token的上下文窗口,图像输入,结构化输出,函数调用,提示缓存,批量处理,工具搜索,内置计算机使用,托管shell,应用补丁,技能,MCP和网络搜索。GPT-5.5默认采用中等推理力度。