每日HackerNews RSS

arXivLabs 是一个框架,允许合作者直接在我们的网站上开发和共享 arXiv 的新功能。与 arXivLabs 合作的个人和组织都认同并接受我们关于开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于践行这些价值观,并仅与同样遵守这些价值观的合作伙伴进行协作。您是否有关于为 arXiv 社区创造价值的项目构想?了解更多关于 arXivLabs 的信息。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Qwen-AgentWorld: 面向通用智能体的语言世界模型 (arxiv.org) 8 分,由 ilreb 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 在我的阁楼上搜寻百万位素数 (primecrunch.com) 7 点,作者:andyhedges,1 小时前 | 隐藏 | 过往 | 收藏 | 1 条评论 帮助 sudo_cowsay 27 分钟前 [–] 看起来很有趣。就像 BOINC 一样。我希望有更多像 BOINC 这样的项目。 回复 准则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

**HALO** 是一个框架和工具集,旨在利用 RLM(递归语言模型)方法构建递归自我改进的智能体架构。它通过分析生产环境的执行追踪数据,识别诸如幻觉工具调用或拒绝循环等通用编码智能体常忽略的系统性故障,从而优化人工智能体的性能。 **主要功能:** * **自动化优化循环:** HALO 从您的智能体收集兼容 OpenTelemetry 的追踪数据,将其输入 HALO-RLM 引擎进行模式诊断,生成可执行的提示词或架构修复方案,并重新部署以实现持续改进。 * **专业化分析:** 不同于可能过度拟合单个错误的通用编码助手,HALO 使用专业引擎在各种高流量、高变异性的智能体行为中归纳分析结果。 * **性能提升:** HALO 在 AppWorld 等基准测试中已取得显著成功,使 Gemini 3 Flash 和 Sonnet 4.6 等模型在成功率方面实现了两位数的增长。 **快速上手:** 开发者可通过 `pip install halo-engine` 安装命令行工具(CLI)或使用 HALO 桌面应用程序。它能轻松集成到现有工作流程中,仅需提供一个 JSONL 格式的追踪文件和一个兼容 OpenAI 的 API 密钥,即可开始对智能体系统进行诊断与优化。

HALO (Hierarchical Agent Loop Optimizer) 是一款全新的开源工具,旨在通过分析执行轨迹来调试和优化 AI 智能体。与传统手动方法不同,HALO 利用递归语言模型 (RLM) 将大型数据集分解为更小、易于管理的子问题。这种方法使开发人员能够识别数千条轨迹中的系统性故障模式,而这些数据量通常超出了标准大语言模型的上下文窗口或推理能力。 该工具支持符合 OTEL 标准的轨迹(例如来自 Langfuse 或 Arize 的数据),并可选择性地导入本地代码库上下文,以提供更精确、可执行的见解。通过分析、报告、修复和重新运行的迭代循环,HALO 有助于在生产规模下维持智能体的性能。HALO 作为本地桌面应用程序提供,使开发人员无需复杂的配置或担忧数据隐私,即可进行深度分析。

要使用 Mastodon 网络应用,请启用 JavaScript。或者,尝试为您所使用的平台下载 Mastodon 原生客户端。

这篇 Hacker News 的讨论主要聚焦于近期市场操作(特别是涉及 SPCX 及其他科技公司)对各大指数基金的影响,并引发了人们的担忧。 参与者们表达了不安,认为像 VTI(全美股市指数基金)和纳斯达克指数这类基金,正被迫买入可能贬值的投机性资产。虽然标普 500 指数因其对盈利能力和存续年限有着更严格的要求,从而在很大程度上规避了这些持仓,但批评者指出,纳斯达克指数为了促成这些强制性收购而修改了规则,这一做法极具争议,并可能损害投资者的利益。 此次讨论反映出指数基金的完整性与激进的市场操纵行为之间日益加剧的矛盾。怀疑论者认为,这种模式类似于“拉高出货”的骗局,最终将由被动投资者买单。因此,一些用户开始质疑全市场指数基金的可靠性,认为目前的系统正变得对曾经提供稳定性的主体不利。

**DiffusionBench** 是一个全面且统一的代码库,旨在通过为扩散 Transformer 提供整体基准测试,突破传统的 ImageNet 评估方式。它通过单一且精简的接口,支持包括 ImageNet(类条件)和文生图(T2I)在内的多种生成任务的训练与评估。 该代码库提供了丰富的模块化组件库,包括: * **编码器与潜空间:** 支持超过 30 种 RAE、VAE 和表示编码器(如 DINOv2、SigLIP2)。 * **模型架构与目标函数:** 包含多种输出预测方式、流匹配技术,以及 LightningDiT 和 JiT 等架构。 * **评估指标:** 除了标准的 FID/IS 指标外,还整合了 GenEval、DPGBench 和 VQAScore 等先进的评估基准。 DiffusionBench 采用分阶段训练工作流——先进行分词器训练,随后进行扩散建模——并配备了预配置设置,以实现无缝的复现和实验记录。该项目强调可扩展性与可复现性,欢迎社区贡献新的评估维度、指标及模型检查点,共同为生成式 AI 研究建立更稳健的标准。

抱歉。

请启用 JavaScript 和 Cookie 以继续。

这场 Hacker News 讨论聚焦于一篇观点文章,该文章指出美国在“9·11”事件后的“反恐战争”中,通过牺牲公民自由换取安全,从而助长了向独裁统治的转变。 评论者大都认为,《爱国者法案》及随后的国家安全政策侵蚀了宪法权利,营造了一种国家拥有过度权力将异见者贴上“敌人”标签的氛围。许多参与者认为,这种转变从根本上改变了美国民主,使临时的战时权力成为了治理的永久性特征。 这场讨论反映了更广泛的焦虑: * **历史性失败:** 一些用户认为美国落入了本·拉登设下的陷阱,其意图是通过引诱美国卷入毁灭性的冲突和国内分裂来削弱美国。 * **政治极化:** 一些人认为那个时代使公众极化,创造了一种至今仍然存在的“我们与他们”的对立心态。 * **制度批判:** 另一些人将这种衰落归咎于石油美元体系的瓦解,认为随着经济繁荣的减退,国家越来越依赖利用恐惧来维持控制。 * **其他视角:** 尽管大多数人关注政府的权力越界,但也有评论者认为,企业监控和经济问题比起国家层面的安全政策,是对自由更为严重的威胁。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 如何跨越全球运输一头白鲸 (cbc.ca) 7 点,由 curmudgeon22 于 1 小时前发布 | 隐藏 | 过往 | 收藏 | 讨论 帮助 | 指引 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com