每日HackerNews RSS

ClawHub 2 天前

## Showboat & Rodney:演示编码代理工作 编码代理的日益普及,需要工具来验证其输出,而不仅仅是自动化测试。作者最近发布了两个这样的工具:**Showboat** 和 **Rodney**。 **Showboat** 帮助代理通过自动构建 Markdown 文档来*演示*其工作。代理使用 CLI 添加注释、执行命令(包含输出)和嵌入图像,从而创建清晰、可验证的功能记录。这允许快速审查,并有助于防止代理通过直接编辑演示文件来“作弊”。 **Rodney** 是一个基于 Rod Go 库构建的 CLI 浏览器自动化工具,旨在*与* Showboat 协同工作。它使代理能够与 Web 界面交互、捕获屏幕截图,并将它们包含在 Showboat 演示中。 这些工具解决了即使在测试驱动开发的情况下,对手动验证的需求。虽然测试对于有针对性的代码创建很有价值,但它们不能保证完全的功能。Showboat 和 Rodney 提供了一种视觉上确认代理构建的功能按预期工作的方式。 这两个工具都是为代理设计的,依赖于全面的 `--help` 输出来提供指导。值得注意的是,两者大部分都是使用 Claude Code 在手机上开发的,这突显了移动驱动的代理工作流程日益增强的强大功能。

西蒙·威利森介绍了两个新工具,**Showboat** 和 **Rodney**,旨在帮助开发者借助人工智能代理来演示和测试他们的工作。**Showboat** 允许代理生成和执行 CLI 命令,并将命令及其输出直接记录到 Markdown 文档中以供审查——本质上创建了一个自动化的、可验证的演示。**Rodney** 专注于浏览器自动化,为 Playwright 提供了一种替代方案,尽管威利森指出 Playwright 在当前模型上的表现很强。 讨论强调了改进威利森博客设计响应速度的愿望,并探讨了使用 Markdown 作为文档和可执行输出的优势,类似于 Jupyter notebooks。用户还讨论了替代工具,如 `playwright-cli` 和 `agent-browser`,以及人工智能自动化冲刺计划等任务的潜力。一个关键点是,代理被设计为*报告*命令而不是直接修改文件,从而实现可审查的工作流程。这些工具旨在简化构建和演示人工智能驱动功能的流程。

## 软件领域的“SaaSpocalypse”:人工智能的快速影响 上周,由于Anthropic发布Claude Cowork插件,软件、金融服务和资产管理领域出现了2850亿美元的市场价值大幅下跌。市场反应迅速,质疑当单个AI代理可以处理整个工作流程时,是否需要多个软件许可——这种现象被称为“SaaSpocalypse”。 这不仅仅是一次抛售,而是一种根本性的转变。过去,软件颠覆了电子表格,提供了精美的界面和按席位定价,以及高利润率。现在,AI代理正在颠覆*软件*本身。公司正在从使用SaaS工具的团队转向由众多、经济高效的AI代理增强的小型团队,这些代理能够执行定制工作流程并实现全天候运行。 关键驱动因素是“能力过剩”——AI模型的强大程度远超当前的应用水平,但最近的进展(例如OpenAI的GPT-5.3-Codex,甚至*帮助构建了自身*)和改进的工具正在释放这种潜力。高盛和挪威银行等企业已经看到了显著的生产力提升,优先投资人工智能而非传统的IT支出。 未来将青睐拥有独特数据、强大API和可组合性的公司——例如彭博社或Stripe——而那些依赖于商品化用户界面的公司将面临颠覆。按席位许可的时代正在消退,取而代之的是以API驱动的模型,其中智能而非界面是核心价值。

这次黑客新闻的讨论围绕一篇文章,该文章声称人工智能正在取代SaaS(软件即服务)。然而,评论者们大多不同意这一观点。 一个关键点是,SaaS *提供*一致且非临时性的工作流程——这正是人工智能,由于其易变性,难以实现的目标。虽然人工智能可以帮助*构建*工作流程软件,但它不应直接*取代*已建立的流程。 一些用户怀疑原始文章是由人工智能生成的,并将最近SaaS估值下降归因于市场价值膨胀的修正,而非人工智能的颠覆。一位定制软件开发者表达了谨慎的乐观态度,认为他们专注于自动化物理工程流程可以提供一些保护,并且人工智能甚至可能带来更复杂、更有趣的项目。最终,普遍的看法是,人工智能是一种*增强*软件开发的工具,不一定会使其*过时*。

## mdvi:一个受 Vim 启发的终端 Markdown 查看器 mdvi 是一个用 Rust 构建的快速、全屏终端 Markdown 查看器,提供流畅的阅读体验和 Vim 风格的导航。它利用 `crossterm` 和 `ratatui` 提供高质量的 TUI,并使用 `pulldown-cmark` 进行准确的 Markdown 渲染,支持常见的元素,如标题、列表、代码块、链接和表格。 主要功能包括流畅的键盘导航(箭头键、翻页键、Vim 快捷键如 `j/k`、`Ctrl-f/b`、`gg/G`)、文件更改时的实时重新加载 (`r`),以及从特定行开始查看 (`--line`) 的能力。 mdvi 专为大型文件设计,优先考虑性能和可预测性。它以单个静态二进制文件的形式分发,并受益于 Rust 强大的工具和生态系统。安装很简单,可以使用 Homebrew:`brew tap taf2/tap && brew install mdvi`。

## mdvi:一个新的 Markdown 命令行查看器 一个名为 **mdvi** (github.com/taf2) 的新命令行 Markdown 查看器最近在 Hacker News 上分享,引发了大量讨论。该工具提供 VI 键绑定用于导航,并拥有简洁的代码。开发者根据初步反馈迅速添加了截图和图片支持。 这次讨论引发了关于现有 Markdown 查看器的更广泛讨论,提到了几种替代方案,包括 **Glow** (charmbracelet/glow)、**lnav** 结合 `find` 和 `fzf`、**mdriver** 和 **glamour**。用户还强调了 NeoVim (使用 `render-markdown.nvim`) 和 Emacs 等编辑器中的选项。 一些人争论了这种工具的必要性,指出 Markdown 本身作为纯文本具有可读性,并且有像 `more` 这样基本的工具可用。然而,其他人则赞赏了无需将更改推送到仓库即可进行本地迭代的便利性,这是 mdvi 的主要优势。讨论还涉及终端美学,一些人更喜欢透明背景或 Glow 提供的颜色支持。

最近,《截距》的一项调查显示,谷歌向美国移民及海关执法局(ICE)提供了大量关于英国学生活动家和记者阿曼德拉·托马斯-约翰逊的个人数据,包括信用卡和银行账号等敏感财务信息。此事发生在托马斯-约翰逊参与抗议活动并随后在特朗普时代针对巴勒斯坦抗议支持者的行政命令下躲藏之后。 与一个类似案件中,收到传票的方成功挑战了该请求不同,托马斯-约翰逊没有收到事先通知,并在得知数据共享后逃离美国。ICE的传票缺乏正当理由,仅基于与移民执法的一般联系,并要求谷歌禁止通知托马斯-约翰逊。 电子前沿基金会和美国公民自由联盟现在敦促谷歌等科技公司在遵守类似传票之前向用户提供通知,并抵制保密令。人们越来越担心科技公司对政府索取用户数据的请求挑战不足,可能违反隐私承诺。专家呼吁对《存储通信法》进行法律改革,并加强对大型科技公司与政府共享数据的行为的监管。目前居住在塞内加尔的托马斯-约翰逊,尽管存在风险,仍然致力于他的新闻工作。

## Google & ICE 数据共享:摘要 一份最新报告详细说明了谷歌在收到行政传票后,向 ICE(美国移民及海关执法局)移交了一名学生记者的银行和信用卡号码——该传票未经法官审查。 这引发了 Hacker News 上关于隐私、政府过度干预和企业责任的讨论。 虽然一些人认为在获得有效搜查令的情况下交出数据是可以接受的,但担忧的中心在于授予 DHS(国土安全部)签发这些行政传票的广泛权力,绕过了司法监督。 批评者担心 ICE 正在利用这些传票进行大规模逮捕,而没有正当程序。 这场讨论凸显了一个核心问题:存在允许机构拥有广泛自由裁量权的“影子”司法系统。 用户们辩论了保护自己的方法,建议避免使用美国科技公司(尽管承认这样做很困难),并质疑谷歌的数据收集行为。 许多人指出谷歌并非个例;其他科技巨头也在与 ICE 合作。 这起事件引发了一个问题:公司是否应该更积极地挑战这些传票,即使在法律上被要求遵守,以及是否需要采取更强有力的反垄断措施来限制这些数据丰富的公司的权力。 最终,这场讨论强调了人们对数字时代隐私日益增长的担忧以及政府滥用权力的可能性。

## Stripe-No-Webhooks:简化的 Stripe 集成 Stripe-no-webhooks 是一个具有明确观点的库,旨在简化 Stripe 支付的实施,特别是对于使用 PostgreSQL 数据库的 Next.js 应用程序。它通过自动将 Stripe 数据同步到数据库来消除手动处理 webhook 的需要。 **主要特性:** * **代码定义计划:** 直接在代码中定义订阅计划,然后将其同步到 Stripe 帐户。 * **简化的 API:** 易于使用的 API,用于订阅、积分、钱包余额、充值和基于用量的计费。支持基于座位的计费、税务征收和计划管理。 * **自动 Webhook:** 自动处理 webhook,保持数据库同步。 * **可定制的回调:** 使用可选的回调(例如 `onSubscriptionCreated`)实现自定义逻辑。 * **定价页面生成:** 自动生成可定制的定价页面,包含计划选择和结账功能。 **设置:** 1. 通过 npm 安装:`npm install stripe-no-webhooks stripe` & `npx stripe-no-webhooks init`(提供 Stripe 密钥、数据库 URL 和站点 URL)。 2. 运行迁移:`npx stripe-no-webhooks migrate` 以创建数据库模式。 3. 在 `billing.config.ts` 中配置计划。 4. 将计划同步到 Stripe:`npx stripe-no-webhooks sync`。 5. 在 `lib/billing.ts` 中实现用户解析。 该库还提供用于管理订阅、处理积分/钱包/用量以及提供客户门户的工具。它旨在简化复杂的计费场景并减少开发开销。完整文档请访问 [https://github.com/pretzelai/stripe-no-webhooks](https://github.com/pretzelai/stripe-no-webhooks)。

启用 JavaScript 和 Cookie 以继续。

## Livedocs:AI驱动的数据分析 Livedocs 是一款AI智能体,旨在快速分析数据并提供洞察,将问题转化为结果,仅需几秒钟。它通过直观的界面赋予团队“数据超能力”——只需上传数据或连接数据源,即可开始提问或使用指令。 Livedocs 提供广泛的预置分析,包括销售趋势分析、客户细分、收入预测和客户流失预测。它还支持更技术性的任务,如 SQL 查询构建、数据清洗和时间序列分析。 除了特定分析,Livedocs 还支持构建交互式仪表盘、合并数据集、检测异常以及优化营销投资回报率和库存等领域。它是一款适用于销售、营销、产品和财务等专业人士的多功能工具。 Livedocs 免费开始使用,无需信用卡,旨在使数据分析更易于访问和高效。

## LiveDocs:原生AI数据分析工作区 LiveDocs (livedocs.com) 是一款为复杂分析而重建的数据工作区,超越了传统仪表盘。与静态笔记本不同,LiveDocs 作为一个“活系统”运行,拥有响应式笔记本环境,其中单元格相互连接——更改会自动重新计算受影响的区域。它支持 SQL、Python、图表和文本的混合使用,可在本地运行 DuckDB/Polars,或连接到 Snowflake、BigQuery 和 Postgres 等数据仓库。 其关键特性是集成的AI代理,它可以*规划和执行*多步骤分析,编写/调试代码,甚至构建自定义UI(超越图表),用于交互式应用程序——类似于 Retool。所有操作都是实时协作的。 创始人正在寻求反馈,特别是来自熟悉分析系统和“与数据对话”工具的用户,以便完善平台。定价从每月15美元起,提供免费版本,需要注册才能配置沙箱以访问数据。评论中提出的担忧包括使用 Snowflake 等数据仓库的潜在成本,以及与 Hex 等现有工具的比较。

## ClioAI/kw-sdk:用于AI知识工作的Python SDK ClioAI SDK是一个Python工具,旨在构建能够处理复杂“知识工作”的AI代理——例如研究、分析、写作和战略决策。与编程不同,知识工作缺乏明确的“通过/失败”测试,并且具有庞大且未定义的解决方案空间。该SDK通过引入**评分标准**来解决这个问题:预定义的评估“良好”工作的标准,从而实现自我验证和迭代改进。 该SDK在一个自我验证的循环中运行:任务创建、评分标准生成、任务执行(利用网络搜索和代码执行等工具)以及根据评分标准进行验证。如果验证失败,代理会迭代;如果通过,则提交结果。 主要功能包括多种模式(“标准”、“计划”、“探索”、“迭代”)以适应不同类型的任务,以及可扩展性以支持自定义模式和提供程序。它支持流行的LLM(Gemini、OpenAI、Anthropic),并提供文件访问和用户澄清等工具。 该项目已开源,以促进知识工作AI的发展,因为当前工具主要集中在代码上。创建者希望通过社区贡献来改进验证能力,并可能训练专门用于基于评分标准的评估的模型。该SDK旨在节省开发人员的时间,并解锁AI驱动的研究、推荐和文档生成的新可能性。 您可以在这里找到该项目和安装说明:[https://github.com/ClioAI/kw-sdk](https://github.com/ClioAI/kw-sdk)

## ClioAI 知识工作 SDK 摘要 ClioAI 发布了一个开源 SDK ([https://github.com/ClioAI/kw-sdk](https://github.com/ClioAI/kw-sdk)),旨在解决将 AI 代理应用于“知识工作”的挑战——例如研究、策略和设计等任务,这些任务与编码有很大不同。 该 SDK 将知识工作构建为一个工程问题,采用 **任务 → 简报 → 评分标准 → 工作 → 验证** 的循环。 关键在于,“评分标准”(评估标准)在执行过程中对代理是隐藏的,迫使其真正满足目标,而不是钻空子。 这个循环提供了一个结构化的奖励信号,既可用于代理执行,也可用于强化学习训练。 主要功能包括一个生成多种解决方案及其权衡的 **“探索”模式**,以及用于恢复或分叉代理工作流程的 **检查点**。 该 SDK 支持灵活的执行环境(包括浏览器)以及通过上下文或文档进行工具调用。 核心思想是使知识工作 *可验证*,超越主观评估,实现客观的质量衡量。 该项目采用 MIT 许可,并寻求社区反馈。

## 社会奇点已至 尽管广泛讨论, “奇点” 并非关于机器超越人类智能,而是关于*人类如何应对*人工智能加速的进步。 对五个关键人工智能指标——MMLU分数、智能成本、发布间隔、涌现的研究论文和代码共享——的分析揭示了一个令人惊讶的真相:只有一项显示出双曲线增长,表明真正的奇点——即*人类发现和撰写关于新的AI行为的速度*。 虽然人工智能的能力本身正在线性提升,但人类对它们的关注和焦虑却在加速上升。 这种“社会奇点”,预计将在**2034年1月**左右达到顶峰,并非关于机器变得超级智能,而是关于我们集体处理和应对快速变化的能力不足。 这已经体现在劳动力市场 disruption、机构失灵(如监管滞后)、资本集中、对人工智能信任的侵蚀以及政治重新调整中。 作者认为,这些 disruption 并非在等待先进的人工智能,而是*因为*人们对未来发展轨迹的认知而正在发生。 关键要点:奇点不是一个技术事件,而是人类应对加速变化的能力崩溃,并且它已经开始。

更多

联系我们 contact @ memedata.com