## 本地LLM Agent流水线总结 此笔记本演示了使用本地LLM Agent流水线构建自主代理,能够使用各种工具执行复杂任务。该流水线支持基于云(例如OpenAI、Anthropic、Gemini)和本地LLM(例如Ollama、vLLM、llama.cpp),这些LLM支持工具调用。 核心组件`AgentExecutor`启动具有访问9个内置工具(文件操作、shell访问、网络搜索)的代理,这些工具可以被定制或通过用户定义的工具进行扩展。可以通过Docker/Podman进行沙箱化以增强安全性。 示例展示了代理执行诸如构建计算器模块和进行财务分析等任务。财务分析示例重点介绍了定义自定义工具(股票价格获取、波动率计算、收益分析)并使用它们生成综合报告。本地模型的使用通过Ollama进行演示,需要适当的网络配置。该流水线简化了代理的创建和执行,能够自动化各种工作流程。
客户端挑战:您的浏览器已禁用 JavaScript。请启用 JavaScript 以继续。网站的必要部分无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置造成的。请检查您的连接,禁用任何广告拦截器,或尝试使用不同的浏览器。
## Zeroboot:亚毫秒级AI代理沙箱
Zeroboot 提供极快的(亚毫秒级p50延迟,约1.7毫秒p99)虚拟机沙箱,用于安全地运行AI代理代码。它通过利用KVM虚拟化和Firecracker快照的新颖的写时复制(CoW)分叉机制来实现这一点。
Zeroboot 不采用传统的VM创建方式,而是将运行时环境预加载到基础VM中,然后通过将快照的内存映射为CoW来快速“分叉”新的隔离VM。这大大减少了启动时间——每个分叉大约0.8毫秒——同时保持硬件强制的内存隔离。
每个沙箱都是一个完整的KVM VM,消耗大约265KB的内存。Zeroboot为Python和TypeScript提供SDK,允许开发者轻松地在这些安全、短暂的环境中执行代码。
Zeroboot目前是一个可用的原型,尚未达到生产级成熟度,但它展示了在快速、安全地为AI应用提供沙箱方面的重大进展。
arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受了我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。
## 致命核心转储:网络迷Mystery **致命核心转储** 是一款互动解谜游戏,背景设定在2216年,挑战玩家调查一颗小行星采矿站的气闸故障。玩家扮演中立仲裁者,判断事故是意外、疏忽还是蓄意破坏。 独特的游戏玩法涉及**调试真实的二进制应用程序**——分析核心转储——以揭示故障的根本原因。这需要具备**GDB、C编程、逆向工程、x86_64汇编以及Linux运行时行为**的技能。 虽然要求较高,但游戏提供了学习资源和基于Web的虚拟机以方便访问。它使用真实的编译代码(GCC 11.4.0),并强调代码分析,而非隐藏在网页中的线索。玩家还可以访问“制作花絮”文档,以获取包含剧透的完整游戏制作过程。
## Forge:植根于您知识的企业级人工智能
Mistral AI推出Forge,一个系统,使企业能够构建基于*自身*专有数据训练的高级人工智能模型,摆脱对通用公开信息的依赖。Forge通过允许组织将独特的知识——政策、代码、流程——直接融入人工智能模型,弥合了广泛人工智能能力与特定业务需求之间的差距。
通过预训练、后训练和强化学习,Forge支持构建能够理解内部术语和工作流程的模型,从而带来更可靠、更准确的企业级智能体。至关重要的是,Forge优先考虑控制和战略自主性;模型始终受组织管理,这对受监管行业至关重要。
Forge支持多种模型架构和多模态输入,并设计用于通过反馈和评估持续改进。其应用范围涵盖政府、金融、软件开发和制造业,为能够执行复杂任务(如政策分析、代码辅助和运营诊断)的智能体提供支持。最终,Forge将人工智能从外部工具转变为战略资产,并*随着*组织专业知识的积累而不断发展。
暂停 重置 预设:8字形螺旋 4体 随机 3D 数据:导出 导入 速度:1倍 积分器:RK4 欧拉 Verlet 碰撞:关闭
## 软件技工的崛起 后转型经济需要一种新的专业知识:不仅要构建软件,还要*维护*它。汤姆·哈特曼是这种转变的典范,在拖拉机修理业务因软件不再仅仅是修复“损坏的代码”,而是更多地关注于完善不精确的规范而衰落后,他成为了一名“软件技工”。这反映了一个更广泛的趋势——硬件和软件之间传统界限的瓦解。专业知识现在在于理解软件所服务的*领域*,无论是农业、医学还是其他任何领域。 汤姆的工作集中在诊断预期功能和实际输出之间的差距,这通常源于上游数据变化或过于简单的规范。像因天气模型更新而导致产量下降的卷心菜农民,或被相互连接、未管理的工具压垮的奶农等客户,突显了挑战。核心问题不是有缺陷的代码,而是将现实世界的细微差别转化为机器可读语言的困难。 汤姆的成功不仅仅是技术上的;它还在于理解人为因素。他强调物理控制,承认用户需要*感觉*自己掌控全局,并提供从快速修复到全面系统编排的解决方案。他所处的领域是预防性维护比危机修复更便宜,但人们本能地对故障做出反应,而不是投资于避免它们。最终,汤姆弥合了日益复杂的科技与社区实际需求之间的差距。
## 动态视频速度调整 Chrome 扩展 - 摘要 这个 Chrome 扩展程序智能地调整视频播放速度,以规范语速,从而在不牺牲理解的情况下加快内容消费速度。它通过使用 Web Audio API 分析页面上最大的视频元素的音频轨道来实现。 该扩展程序的核心在于其音节速率检测算法。在隔离关键元音频率(300-3000Hz)后,它分析能量包络调制——特别是过零率——来估计说话者说话的速度。 以前使用峰值计数和 AudioWorklets 的迭代由于语音特征和浏览器安全策略而面临限制。 检测到的速率随后用于计算目标播放速度,旨在达到每秒 9 个音节的稳定速率(用户可调整)。 速度变化被平滑处理,以避免突兀的过渡。 用户界面提供对目标速率、最小/最大速度的控制,并显示实时数据,例如当前速度、估计的音节速率和能量水平。 局限性包括与 DRM 保护的内容不兼容以及音乐或多个说话者可能出现不准确的情况。 未来的改进可能包括语音活动检测和针对每个说话者的自适应调整。