**HALO** 是一个框架和工具集,旨在利用 RLM(递归语言模型)方法构建递归自我改进的智能体架构。它通过分析生产环境的执行追踪数据,识别诸如幻觉工具调用或拒绝循环等通用编码智能体常忽略的系统性故障,从而优化人工智能体的性能。
**主要功能:**
* **自动化优化循环:** HALO 从您的智能体收集兼容 OpenTelemetry 的追踪数据,将其输入 HALO-RLM 引擎进行模式诊断,生成可执行的提示词或架构修复方案,并重新部署以实现持续改进。
* **专业化分析:** 不同于可能过度拟合单个错误的通用编码助手,HALO 使用专业引擎在各种高流量、高变异性的智能体行为中归纳分析结果。
* **性能提升:** HALO 在 AppWorld 等基准测试中已取得显著成功,使 Gemini 3 Flash 和 Sonnet 4.6 等模型在成功率方面实现了两位数的增长。
**快速上手:**
开发者可通过 `pip install halo-engine` 安装命令行工具(CLI)或使用 HALO 桌面应用程序。它能轻松集成到现有工作流程中,仅需提供一个 JSONL 格式的追踪文件和一个兼容 OpenAI 的 API 密钥,即可开始对智能体系统进行诊断与优化。
要使用 Mastodon 网络应用,请启用 JavaScript。或者,尝试为您所使用的平台下载 Mastodon 原生客户端。
**DiffusionBench** 是一个全面且统一的代码库,旨在通过为扩散 Transformer 提供整体基准测试,突破传统的 ImageNet 评估方式。它通过单一且精简的接口,支持包括 ImageNet(类条件)和文生图(T2I)在内的多种生成任务的训练与评估。
该代码库提供了丰富的模块化组件库,包括:
* **编码器与潜空间:** 支持超过 30 种 RAE、VAE 和表示编码器(如 DINOv2、SigLIP2)。
* **模型架构与目标函数:** 包含多种输出预测方式、流匹配技术,以及 LightningDiT 和 JiT 等架构。
* **评估指标:** 除了标准的 FID/IS 指标外,还整合了 GenEval、DPGBench 和 VQAScore 等先进的评估基准。
DiffusionBench 采用分阶段训练工作流——先进行分词器训练,随后进行扩散建模——并配备了预配置设置,以实现无缝的复现和实验记录。该项目强调可扩展性与可复现性,欢迎社区贡献新的评估维度、指标及模型检查点,共同为生成式 AI 研究建立更稳健的标准。
请启用 JavaScript 和 Cookie 以继续。
2025年7月,得克萨斯州阿尔瓦拉多市草原地(Prairieland)移民拘留中心发生了一起抗议活动,八名被告因此被判处30年至100年不等的监禁。定罪罪名包括骚乱、为恐怖分子提供物质支持及爆炸物相关指控;其中本杰明·哈尼尔·宋(Benjamin Hanil Song)因被控企图谋杀警员而被判处最长刑期。 这些指控源于抗议期间示威者与警方之间的交火。在量刑听证会上,宋为其行为辩护,称那是为防止抗议者被执法人员杀害而采取的必要干预措施。包括其家人和社区领袖在内的支持者谴责这些判决“残忍”且“不成比例”,并指出审判过程中存在政府偏见、虚假信息以及未得到解决的陪审员不当行为报告。 辩护团队及支持者坚持认为,被告是因为行使对拘留中心运作表达异议的权利而遭到针对。在重审请求被驳回后,被告已表示将对定罪提出上诉,并坚称争取自由的斗争仍在继续。该案的其他被告预计将于7月接受判决。
QSOE 的首个版本(v0.1)现已发布,它在两个不同的微内核之上提供了一个统一的、兼容 QNX 的环境。该软件包包括 QSOE/N(使用“Skimmer”内核)、QSOE/L(基于 seL4 v15 构建)、mr-bml 引导加载程序、quser 环境(包含 qsh)以及 libc v0.6。 此版本的一个关键里程碑是两种内核变体均能通过 NVMe 存储在 SiFive Unmatched (FU740) 硬件上启动并进入交互式登录 Shell。为了实现这一目标,团队通过将 Sync* 和设备中断脉冲转移到内核直接路径,解决了 taskman 进程中复杂的死锁问题。尽管内核有所不同,但它们共享一致的用户空间,从而实现了该项目在不同架构之上提供统一接口的目标。 源代码已在 GitLab 上以 Apache-2.0 许可证发布,二进制文件和文档可在 qsoe.net 和 GitHub 上获取。
由于发生安全漏洞导致敏感员工数据泄露给未经授权的内部人员,Meta 已经暂停了其备受争议的“模型兼容性计划”(MCI)。该项目通过收集击键、鼠标移动和屏幕内容来训练人工智能系统,长期以来一直因隐私和监控问题受到员工的批评。 6 月 18 日发现的安全问题导致内部人员可以访问包含 MCI 收集信息的数据库。尽管 Meta 声称没有数据被不当访问,但该事件引发了强烈的抵制,促使公司暂停了该计划。Meta 高管此前曾为该计划辩护,称其是训练人工智能的必要措施;然而,他们现在表示公司已经收集了“足够的数据”来评估该工具的长期效用。 此次暂停发生在该公司管理层与员工之间日益紧张的关系背景下,员工指责管理层忽视了此类侵入式追踪所带来的风险。Meta 确认,在能够确保其数据保护控制措施有效之前,该计划将保持停用状态。
**y** 是一个自我演进、以本地优先的桌面编程环境,旨在让软件像它所创建的代码一样具有可塑性。与静态的智能体应用不同,y 允许用户通过专用的“修改”轨道实时调整应用的 UI,同时将核心功能保护在安全的内核之中。
主要功能包括:
* **自我修改:** 用户可以编辑实时 UI,内置的安全机制允许在修改导致功能异常时即时回滚。
* **本地智能体编排:** y 不充当代理,而是通过用户自己的身份验证在本地运行首选的编程智能体(如 Claude Code 或 Codex),确保完全掌控。
* **工作流灵活性:** 支持用于并行智能体任务的隔离工作区,并提供以聊天为核心的界面,而非传统的编辑器克隆。
* **隐私优先:** 应用将项目文件、终端指令和提示词保留在本地,仅向开发者发送非敏感的应用健康分析数据。
目前,y 正处于 macOS 平台的积极开发阶段。它将应用界面视为一种可自定义的工具,让用户能够在不牺牲安全性或性能的前提下,真正拥有自己的编程工作空间。