每日HackerNews RSS

## 解决 Web Agent 身份验证问题:rtrvr & Subroutines 大多数 Web Agent 在扩展到单个任务之外时会遇到困难,因为 Web 身份验证(cookie、轮换令牌和特定于浏览器的安全措施)非常复杂。直接调用 API 会失败,因为身份验证才是真正的挑战。rtrvr 通过**在用户浏览器*内*记录和重放 Web 交互**来解决这个问题,利用浏览器现有的会话和安全环境。 rtrvr 不会重建身份验证,而是会在执行任务期间拦截网络请求,对其进行排序以识别相关的 API 调用(过滤掉分析和噪音),然后直接从页面上下文重放它们。这创建了**“Subroutines”**——可供 Agent调用的工具,例如发送 LinkedIn 请求或发布到 X。 Subroutines 作为确定性 JavaScript 脚本运行,最大限度地减少 LLM 的 token 使用量并确保可靠性。Agent 选择参数,但实际操作本身是一个脚本,而不是持续推理。rtrvr 提供了一个辅助命名空间 (`rtrvr.*`) 用于常见的 Web 交互,简化了 Subroutine 的创建。 这种方法旨在构建一个**可靠 Web 操作的共享库**,超越理论上的 Agent 能力,实现实用且可扩展的自动化。rtrvr 随附了针对流行平台和功能的初始 Subroutines,以及自定义 LLM 订阅和工作流程调度的集成。

对不起。

## 设计工具的未来:回归代码 最近使用 Claude Design 的体验预示着设计领域即将发生转变,这源于人工智能的兴起以及 Figma 等现有工具的局限性。Figma 的成功在于创建了一个系统化、"规范化"的设计环境,但这也导致了组件、变量和覆盖层等复杂且常常令人沮丧的系统。这种复杂性反而削弱了 Figma 在人工智能时代的相关性,因为 LLM 是在 *代码* 上进行训练的,而不是 Figma 的专有元素。 作者认为,真相的来源将回归代码,使 Figma 复杂的系统变得过时。Figma 现在被困在手动、人工智能之前的流程中。未来设计工具可能会出现分叉:一条路径,以 Claude Design 为例,拥抱直接的代码操作以及与编码伙伴的无缝集成。另一条路径将是一个纯粹的探索环境,摆脱系统约束——一个用于快速原型设计和视觉实验的空间,可能类似于更强大的 Photoshop 或简化的 iPad 素描应用程序。 最终,作者认为 Figma 的辉煌时刻正在消退,敦促 Sketch 等竞争对手大胆创新,超越基本功能。“材料的真实性”是关键——Claude Design 通过根本建立在 HTML 和 JS 之上提供了这一点。

## 无头服务崛起与设计的未来 应用程序和服务交互的未来正朝着“无头”架构转变——为人工智能代理提供访问,而无需传统的用户界面。这得益于人工智能辅助带来的卓越用户体验,以及与屏幕抓取 GUI 相比,人工智能任务的更高可靠性。 这种转变已经发生,这体现在像 MCP 这样的 AI 专用 API 的出现以及命令行界面 (CLI) 的普及。像 Google Workspace CLI (gws) 和 Salesforce CLI 这样的工具允许通过文本命令直接与服务交互,从而为人工智能实现强大且可组合的工作流程——并且越来越多地,为用户提供服务。 CLI 在安全性方面具有优势,因为最大限度地减少复杂性可以降低漏洞,这对于人工智能发现漏洞的能力而言至关重要。前端设计不会消失,但会演变为专注于建立强大的“氛围”和品牌标识,因为用户很可能主要通过其人工智能代理与服务交互。 重点将从优化用户旅程转移到为人工智能提供安全、简化的访问,从而促使银行和政府部门等企业优先开发强大的 CLI 工具。这代表着我们与技术互动方式的根本性变化,优先考虑人工智能时代的功能性和安全性。

这场 Hacker News 讨论的核心是“无头”应用程序的未来——即为人工智能代理访问而设计的、*没有*传统用户界面的软件——以及个人人工智能的兴起。 Markusw 分享了一个链接,讨论了 interconnected.org 对个人人工智能主导未来的愿景,引发了争论。Stephenlf 预测未来十年将分阶段推出,首先扩展现有的操作系统集成应用程序(如 Microsoft Copilot),最终收敛于一个通用标准,可能由 Apple 领导。 然而,xnx 认为并非*所有*应用程序都需要变为无头,认为人工智能代理将能够熟练地控制现有的图形用户界面。Esafak 反驳说,首先使用 API 重写软件将越来越具有竞争力,而 AndrewDucker 指出 Windows 上现有的辅助功能 API 是一种可行的解决方案。 核心争论在于未来是应该为人工智能访问而重建软件,还是应该赋予人工智能与现有界面交互的能力。

## Remoroo:深度科技的自主研究 Remoroo 是一款自主研究引擎,旨在加速机器学习开发。与提供单一建议的编码代理不同,Remoroo 会在您的代码上运行大量实验(最多 30 个),*过夜*自动编辑、测试和评估更改,基于定义的指标——例如示例中的 `val_bpb`,该指标提高了 31%。 您通过一个简单的规范文件 (`program.md`) 定义实验,指向您的训练和评估代码。它在时间预算内运行,并严格验证和复现结果,提供清晰的“已验证”状态和通过 git 的可追溯历史。 Remoroo 并非关于*猜测*代码,而是关于通过结构化实验*证明*改进。计费基于运行时间(“积分”),并提供免费套餐。它专为寻求可扩展、可靠的方式来自动化和加速其机器学习研究流程的深度科技团队设计。

对不起。

## 美国-伊朗冲突中的可疑投注与潜在内幕交易 在线预测市场和商品期货中出现了一波时机把握得异常精准的投注,引发了人们对与美国-以色列伊朗相关发展相关的潜在内幕交易的担忧。大量投注准确预测了事件——包括美国空袭、阿亚图拉·哈梅内伊的遇刺以及停火公告——为一些交易者带来了巨额利润。 具体而言,Polymarket上的16个账户在预测2月份空袭方面获得了超过10万美元的收益,而一位用户在哈梅内伊被报道死亡*之前*,押注其被移除获得了超过55万美元的利润。类似的活动也发生在停火公告期间,与石油价格大幅下跌(9.5亿美元)的投注同时发生。 这些模式被描述为“狂野西部”般的情况,表明可能有人利用提前获得的知识来操纵这些市场。商品期货交易委员会(CFTC)据报道正在调查此事,但由于有限的执法能力、技术障碍以及与各州的管辖权纠纷而面临挑战。 专家指出,证明这些新兴市场中的非法内幕交易非常复杂,而且现行法律无法有效应对区块链技术提供的匿名性。一项两党法案旨在禁止政府官员参与这些市场,但核心问题仍然是:确保在一个日益复杂的环境中进行公平和透明的交易。

## 预测市场与内幕交易:摘要 一份最新报告显示,在伊朗战争爆发前,有超过10亿美元的赌注通过预测市场以惊人的时机下注。 这引发了黑客新闻的讨论,中心围绕这些市场的伦理和功能。 许多评论员认为,成功的预测需要内幕信息,质疑这些市场是否本质上依赖于——并可能促成——非法内幕交易。 有人建议人工智能可以追踪大量潜在的非法赌注。 另一些人指出,与国家相关的行为者可能利用这些平台进行情报收集。 一个关键的争论围绕预测市场的价值。 有人认为它们通过揭示内幕信息为公众提供有价值的见解,而另一些人则认为它们主要使那些*拥有*内幕信息的人受益,可能助长“赌博流行病”并剥削弱势投资者。 人们对这些市场可能被用于非法活动以及缺乏监管表示担忧。 一些评论员强调了建立在信息不对称和人为稀缺性基础上的平台的更广泛的伦理影响,并将它们与更广泛的社会问题联系起来,例如财富不平等和信任的侵蚀。

1910年,路易斯·“巴德”·艾伯内西(10岁)和他的弟弟坦普尔(6岁)从俄克拉荷马州骑马开始了长达2000英里的旅程,前往纽约市。他们继承了父亲杰克·“活捉”·艾伯内西的冒险精神——他是一位传奇的美国法警,以徒手为罗斯福总统捕获狼等壮举而闻名。 在父亲的祝福下,以及一系列安全规则(每日有限的行程、不得在无人监督的情况下过河、携带少量现金、以及周日不骑马)的约束下,兄弟俩于四月出发。巴德骑着他父亲著名的马“萨姆·巴斯”,而坦普尔骑着“杰罗尼莫”,每天都需要帮助才能上马。 他们携带了食物、床铺和马的燕麦等必需品,并运用牛仔战术来确保夜间安全。这次雄心勃勃的旅行是为了与罗斯福总统从非洲归来时相遇,艾伯内西一家希望能在纽约与他见面。

## 男孩骑马之旅引发对时代变迁的讨论 一篇2018年的文章,讲述了美国法警的两个儿子从俄克拉荷马州骑马到纽约的故事,在Hacker News上引发了讨论。 这篇文章促使人们反思,这种带着确认他们不是逃跑犯的信件进行的冒险,与现代育儿方式和安全担忧形成了鲜明对比。 评论者分享了长途骑马的经验,强调了后勤挑战,例如水源获取以及对已建立支持网络的需求(如澳大利亚的马道和休息站)。 还有人指出了类似的 historical 旅程,包括1967年的一次前往世界博览会的 pony-cart 旅行以及每年的 Pony Express 重演。 对话还涉及了社会变革,一些人哀叹从“自由放养”的童年转向了日益增长的监视和限制,甚至在看似安全的机构(如宗教机构)中也是如此。 最终,这个帖子反映了人们对失去独立性和信任的看法,即不允许孩子们体验冒险。

## Fly.io 分布式系统挑战:只增计数器总结 本文详细介绍了在使用 Fly.io 的 Maelstrom 平台及其 `SeqKV` 服务构建只增计数器时遇到的挑战。核心任务——在分布式节点上递增和读取计数器——由于并发操作,证明出乎意料地复杂。简单的实现会丢失更新,凸显了对原子操作的需求。 使用 `SeqKV` 的 `CompareAndSwap` (CAS) 提供了一种解决方案,但结果是不确定的。探索无冲突复制数据类型 (CRDT),特别是 G-Counter,提供了一种替代方案,其中每个节点管理自己的计数器,从而消除了写入冲突。然而,这种方法仍然依赖 `SeqKV` 来求和值,如果没有 gossip 机制,就无法实现真正的 CRDT 实现。 关键在于理解 `SeqKV` 的 *顺序一致性* 模型。虽然它保证了操作的总顺序,但它允许出现陈旧读取等异常。测试的 10 秒冷却期加剧了这种情况。最终,一种“hacky”的解决方法——在每次读取之前进行一次唯一的写入——迫使在 `SeqKV` 的限制范围内获得最新的视图。更强大的解决方案包括实现完整的 CRDT 或切换到像 `LinKV` 这样的线性化键值存储。该挑战强调,理解底层一致性模型和实现细节至关重要,而不仅仅是理论知识。

对不起。

## 2026年人工智能:快速进展与日益增长的担忧 – 摘要 2026年斯坦福人工智能指数显示,人工智能能力持续爆炸式增长,美国公司在模型开发方面仍然领先——2025年发布了50个“值得注意”的模型,但中国正在迅速赶上。目前,行业主导了模型创建(90%以上),而中国在机器人部署方面领先,2024年安装的工业机器人数量几乎是美国的3倍。 全球人工智能计算能力自2022年以来每年翻三倍,这主要得益于英伟达的GPU,但这一进展带来了巨大的环境成本——训练像xAI的Grok 4这样先进的模型,可能产生超过72,000吨的碳排放。 尽管存在这些担忧,人工智能在基准测试中正在迅速改进,尤其是在代理任务和医疗应用(药物发现出版物在两年内翻倍)方面。2025年的投资达到创纪录的5810亿美元,GitHub上与人工智能相关的项目激增。然而,人工智能在诸如读取模拟时钟等基本任务上仍然存在困难,凸显了其多模态理解的局限性。 公众认知持谨慎乐观态度(59%的人认为益处大于弊端),但对政府监管的信任度仍然较低,尤其是在美国。这反映了更广泛的趋势,即根据具体应用和地理位置,情绪和结果各不相同。

## 2026年人工智能:黑客新闻总结 近期一份IEEE报告,在黑客新闻上引发讨论,其中包含描绘2026年人工智能发展状况的图表。讨论围绕几个关键点展开了争论。尽管投资者热情高涨,但仍存在怀疑论,尤其是在年轻一代中,对人工智能的益处持保留态度。 人们对训练大型语言模型的碳足迹表示担忧,估算值差异很大(Grok 4可能排放72,000-140,000吨二氧化碳)。然而,有观点指出,与全球排放量或个人碳足迹相比,这种影响相对较小。 报告还强调了中国在工业机器人领域的领先地位,但一些评论员质疑其与人工智能的具体相关性,并指出中国对外国机器人的依赖。一个反复出现的主题是开源人工智能挑战商业霸权的可能性,以及在快速发展的领域中建立持久“护城河”的难度。最后,对报告中使用的指标提出了批评,例如将GitHub项目创建与软件工程专业知识划等号。

离散傅里叶变换 (DFT) 可以通过分治策略得到显著优化。 最初,DFT 被拆分为两个较小的 DFT——一个处理偶数索引数据,另一个处理奇数索引数据。 虽然这种拆分最初并不能提高效率(仍然是 O[N²]),但利用这些子问题中的对称性可以将每个子问题的计算量减少一半,从而有效地将问题规模减半至 O[M²],其中 M = N/2。 这个过程会递归地应用于这些较小的 DFT,*只要*问题规模保持偶数,就会不断地将计算成本减半。 这种递归减半持续进行,直到子问题足够小,可以直接有效地求解。 结果是规模上的显著改进:从 O[N²] 到渐近复杂度 **O[N log N]**,使其成为处理大型数据集的更快算法。 这可以在像 Python 这样的语言中有效地实现,利用原始 DFT 代码来解决小的子问题。

一个黑客新闻的讨论围绕理解快速傅里叶变换(FFT)算法展开,链接到jakevdp.github.io的2013年文章。用户分享了理解该概念的资源,其中一人推荐Reducible的YouTube视频以获得直观理解。 对话延伸到实际应用。一位用户展示了一个视频,演示了FFT在去除电子墨水显示器上漫画屏幕色块伪影中的应用。另一位用户询问如何对网络数据包捕获(pcap)数据执行FFT分析,寻找现有的工具或接口,而不是编写脚本来解决问题。建议包括Lomb–Scargle算法以及频率域网络分析的潜在局限性。一个小的讨论涉及大O记号的表示偏好。

“Outnumbered”节目对至少10名美国知名科学家离奇失踪或死亡的可疑模式进行了评论,其中许多人拥有最高安全级别,而白宫表示他们正在调查此事。白宫正在调查一波神秘的美国科学家失踪或死亡事件,自2024年中以来,至少有10名知名人士,包括天体物理学家和核研究人员,失踪或死亡。这些科学家拥有最高安全级别,并掌握着美国最机密的知识。Emily Compagno和“Outnumbered”节目组讨论了这种令人不安的模式以及潜在的外国间谍活动。

对不起。

更多

联系我们 contact @ memedata.com