每日HackerNews RSS

arXivLabs 是一个框架,允许合作者直接在我们的网站上开发和共享 arXiv 的新功能。与 arXivLabs 合作的个人和组织都认同并接受我们关于开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于践行这些价值观,并仅与同样遵守这些价值观的合作伙伴进行协作。您是否有关于为 arXiv 社区创造价值的项目构想?了解更多关于 arXivLabs 的信息。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Qwen-AgentWorld: 面向通用智能体的语言世界模型 (arxiv.org) 8 分,由 ilreb 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 在我的阁楼上搜寻百万位素数 (primecrunch.com) 7 点,作者:andyhedges,1 小时前 | 隐藏 | 过往 | 收藏 | 1 条评论 帮助 sudo_cowsay 27 分钟前 [–] 看起来很有趣。就像 BOINC 一样。我希望有更多像 BOINC 这样的项目。 回复 准则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

**HALO** 是一个框架和工具集,旨在利用 RLM(递归语言模型)方法构建递归自我改进的智能体架构。它通过分析生产环境的执行追踪数据,识别诸如幻觉工具调用或拒绝循环等通用编码智能体常忽略的系统性故障,从而优化人工智能体的性能。 **主要功能:** * **自动化优化循环:** HALO 从您的智能体收集兼容 OpenTelemetry 的追踪数据,将其输入 HALO-RLM 引擎进行模式诊断,生成可执行的提示词或架构修复方案,并重新部署以实现持续改进。 * **专业化分析:** 不同于可能过度拟合单个错误的通用编码助手,HALO 使用专业引擎在各种高流量、高变异性的智能体行为中归纳分析结果。 * **性能提升:** HALO 在 AppWorld 等基准测试中已取得显著成功,使 Gemini 3 Flash 和 Sonnet 4.6 等模型在成功率方面实现了两位数的增长。 **快速上手:** 开发者可通过 `pip install halo-engine` 安装命令行工具(CLI)或使用 HALO 桌面应用程序。它能轻松集成到现有工作流程中,仅需提供一个 JSONL 格式的追踪文件和一个兼容 OpenAI 的 API 密钥,即可开始对智能体系统进行诊断与优化。

HALO (Hierarchical Agent Loop Optimizer) 是一款全新的开源工具,旨在通过分析执行轨迹来调试和优化 AI 智能体。与传统手动方法不同,HALO 利用递归语言模型 (RLM) 将大型数据集分解为更小、易于管理的子问题。这种方法使开发人员能够识别数千条轨迹中的系统性故障模式,而这些数据量通常超出了标准大语言模型的上下文窗口或推理能力。 该工具支持符合 OTEL 标准的轨迹(例如来自 Langfuse 或 Arize 的数据),并可选择性地导入本地代码库上下文,以提供更精确、可执行的见解。通过分析、报告、修复和重新运行的迭代循环,HALO 有助于在生产规模下维持智能体的性能。HALO 作为本地桌面应用程序提供,使开发人员无需复杂的配置或担忧数据隐私,即可进行深度分析。

要使用 Mastodon 网络应用,请启用 JavaScript。或者,尝试为您所使用的平台下载 Mastodon 原生客户端。

这篇 Hacker News 的讨论主要聚焦于近期市场操作(特别是涉及 SPCX 及其他科技公司)对各大指数基金的影响,并引发了人们的担忧。 参与者们表达了不安,认为像 VTI(全美股市指数基金)和纳斯达克指数这类基金,正被迫买入可能贬值的投机性资产。虽然标普 500 指数因其对盈利能力和存续年限有着更严格的要求,从而在很大程度上规避了这些持仓,但批评者指出,纳斯达克指数为了促成这些强制性收购而修改了规则,这一做法极具争议,并可能损害投资者的利益。 此次讨论反映出指数基金的完整性与激进的市场操纵行为之间日益加剧的矛盾。怀疑论者认为,这种模式类似于“拉高出货”的骗局,最终将由被动投资者买单。因此,一些用户开始质疑全市场指数基金的可靠性,认为目前的系统正变得对曾经提供稳定性的主体不利。

**DiffusionBench** 是一个全面且统一的代码库,旨在通过为扩散 Transformer 提供整体基准测试,突破传统的 ImageNet 评估方式。它通过单一且精简的接口,支持包括 ImageNet(类条件)和文生图(T2I)在内的多种生成任务的训练与评估。 该代码库提供了丰富的模块化组件库,包括: * **编码器与潜空间:** 支持超过 30 种 RAE、VAE 和表示编码器(如 DINOv2、SigLIP2)。 * **模型架构与目标函数:** 包含多种输出预测方式、流匹配技术,以及 LightningDiT 和 JiT 等架构。 * **评估指标:** 除了标准的 FID/IS 指标外,还整合了 GenEval、DPGBench 和 VQAScore 等先进的评估基准。 DiffusionBench 采用分阶段训练工作流——先进行分词器训练,随后进行扩散建模——并配备了预配置设置,以实现无缝的复现和实验记录。该项目强调可扩展性与可复现性,欢迎社区贡献新的评估维度、指标及模型检查点,共同为生成式 AI 研究建立更稳健的标准。

抱歉。

请启用 JavaScript 和 Cookie 以继续。

这场 Hacker News 讨论聚焦于一篇观点文章,该文章指出美国在“9·11”事件后的“反恐战争”中,通过牺牲公民自由换取安全,从而助长了向独裁统治的转变。 评论者大都认为,《爱国者法案》及随后的国家安全政策侵蚀了宪法权利,营造了一种国家拥有过度权力将异见者贴上“敌人”标签的氛围。许多参与者认为,这种转变从根本上改变了美国民主,使临时的战时权力成为了治理的永久性特征。 这场讨论反映了更广泛的焦虑: * **历史性失败:** 一些用户认为美国落入了本·拉登设下的陷阱,其意图是通过引诱美国卷入毁灭性的冲突和国内分裂来削弱美国。 * **政治极化:** 一些人认为那个时代使公众极化,创造了一种至今仍然存在的“我们与他们”的对立心态。 * **制度批判:** 另一些人将这种衰落归咎于石油美元体系的瓦解,认为随着经济繁荣的减退,国家越来越依赖利用恐惧来维持控制。 * **其他视角:** 尽管大多数人关注政府的权力越界,但也有评论者认为,企业监控和经济问题比起国家层面的安全政策,是对自由更为严重的威胁。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 如何跨越全球运输一头白鲸 (cbc.ca) 7 点,由 curmudgeon22 于 1 小时前发布 | 隐藏 | 过往 | 收藏 | 讨论 帮助 | 指引 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

2025年7月,得克萨斯州阿尔瓦拉多市草原地(Prairieland)移民拘留中心发生了一起抗议活动,八名被告因此被判处30年至100年不等的监禁。定罪罪名包括骚乱、为恐怖分子提供物质支持及爆炸物相关指控;其中本杰明·哈尼尔·宋(Benjamin Hanil Song)因被控企图谋杀警员而被判处最长刑期。 这些指控源于抗议期间示威者与警方之间的交火。在量刑听证会上,宋为其行为辩护,称那是为防止抗议者被执法人员杀害而采取的必要干预措施。包括其家人和社区领袖在内的支持者谴责这些判决“残忍”且“不成比例”,并指出审判过程中存在政府偏见、虚假信息以及未得到解决的陪审员不当行为报告。 辩护团队及支持者坚持认为,被告是因为行使对拘留中心运作表达异议的权利而遭到针对。在重审请求被驳回后,被告已表示将对定罪提出上诉,并坚称争取自由的斗争仍在继续。该案的其他被告预计将于7月接受判决。

Hacker News 上出现了一场关于北得克萨斯州一个组织八名成员量刑的讨论。这些人因袭击移民及海关执法局(ICE)设施被定罪,罪名包括谋杀未遂和共谋罪,判处刑期从 30 年到终身监禁不等。 这些判决引发了极化的争论。一些参与者认为惩罚过于严厉,并指出类似罪行的量刑准则通常会导致刑期显著缩短。裁决的批评者称这些判决——特别是针对被控销毁证据人员的 30 年刑期——是“对司法制度的嘲弄”,且可能违宪。 相反,另一些人则为量刑的严厉程度辩护,理由是这些罪行性质严重,包括枪击警官和使用爆炸物。这一派人士强调,被告是由陪审团定罪的,他们的行为,包括在暴力袭击后销毁或隐瞒证据,理应受到严厉的法律制裁。讨论帖中还出现了对该组织性质的分歧,一些人将其贴上“恐怖分子”的标签,而另一些人则驳斥这种说法,突显了围绕此案持续存在的政治分歧。

QSOE 的首个版本(v0.1)现已发布,它在两个不同的微内核之上提供了一个统一的、兼容 QNX 的环境。该软件包包括 QSOE/N(使用“Skimmer”内核)、QSOE/L(基于 seL4 v15 构建)、mr-bml 引导加载程序、quser 环境(包含 qsh)以及 libc v0.6。 此版本的一个关键里程碑是两种内核变体均能通过 NVMe 存储在 SiFive Unmatched (FU740) 硬件上启动并进入交互式登录 Shell。为了实现这一目标,团队通过将 Sync* 和设备中断脉冲转移到内核直接路径,解决了 taskman 进程中复杂的死锁问题。尽管内核有所不同,但它们共享一致的用户空间,从而实现了该项目在不同架构之上提供统一接口的目标。 源代码已在 GitLab 上以 Apache-2.0 许可证发布,二进制文件和文档可在 qsoe.net 和 GitHub 上获取。

抱歉。

由于发生安全漏洞导致敏感员工数据泄露给未经授权的内部人员,Meta 已经暂停了其备受争议的“模型兼容性计划”(MCI)。该项目通过收集击键、鼠标移动和屏幕内容来训练人工智能系统,长期以来一直因隐私和监控问题受到员工的批评。 6 月 18 日发现的安全问题导致内部人员可以访问包含 MCI 收集信息的数据库。尽管 Meta 声称没有数据被不当访问,但该事件引发了强烈的抵制,促使公司暂停了该计划。Meta 高管此前曾为该计划辩护,称其是训练人工智能的必要措施;然而,他们现在表示公司已经收集了“足够的数据”来评估该工具的长期效用。 此次暂停发生在该公司管理层与员工之间日益紧张的关系背景下,员工指责管理层忽视了此类侵入式追踪所带来的风险。Meta 确认,在能够确保其数据保护控制措施有效之前,该计划将保持停用状态。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Meta 在内部数据泄露后暂停员工追踪项目 (wired.com) 23 分,由 1vuio0pswjnm7 在 1 小时前发布 | 隐藏 | 过往 | 收藏 | 1 条评论 deminature 23 分钟前 | 下一条 [–] 先前讨论:https://news.ycombinator.com/item?id=48636632 回复 帮助 指导方针 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com