arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都拥抱并接受了我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与坚持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。
arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都拥抱并接受了我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与坚持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。
## DETR:实时目标检测的新标准
最近的进展推动检测Transformer (DETR) 在目标检测准确率上超越 YOLO 模型,*同时* 保持可比的速度。像可变形注意力机制和去噪训练等创新实现了实时性能,其中 D-Fine 目前处于领先地位。
DETR 的一个关键优势是其宽松的 Apache 2.0 许可,允许不受限制的商业用途——这比 YOLO 更严格的许可具有显著优势。DETR 还通过将检测视为直接集合预测来简化检测过程,从而消除了非极大值抑制等组件。现代 GPU 非常适合 Transformer 中核心的注意力操作,并且从 DINOv3 等模型进行迁移学习可以进一步提高性能。
目前,有两种主要的 DETR 方法在竞争:RT-DETR(优化原始架构,D-Fine 是领导者)和 LW-DETR(使用纯 Vision Transformer 作为骨干网络,RF-DETR 是一个例子)。基准测试表明,D-Fine 和 RF-DETR 的准确率始终优于 YOLO 11。虽然 RF-DETR 在较小、更快的模型方面表现出色,但 D-Fine 在规模上表现更好,并提供更通用的参数效率。
Datameister 已将这些最先进的 DETR 模型集成到他们的视觉库中,为现实世界的应用提供准确高效的检测系统。DETR 的快速发展标志着计算机视觉领域的重大转变,为传统方法提供了一种强大且具有商业可行性的替代方案。
## 智能体构建:经验教训 (2025年11月21日) 构建人工智能智能体仍然是一个复杂的过程,SDK抽象在面对实际工具使用时常常力不从心。本报告详细介绍了最近的经验,强调了对精细控制和底层模型的深入理解的需求。 作者发现像Vercel AI这样的高级SDK虽然善意,但最终因显著的模型差异而阻碍了开发,需要定制抽象。直接访问SDK(OpenAI、Anthropic)提供了更大的控制力,尤其是在缓存方面——Anthropic的明确付费缓存现在更受青睐,因为它具有可预测性。 智能体循环内的强化学习被证明至关重要,可以补充初始指令并帮助从失败中恢复。通过子智能体隔离失败的任务对于防止脱轨至关重要。一个共享的、类似文件系统的层对于跨工具和子智能体的数据一致性至关重要。 输出工具出乎意料地具有挑战性,引导语气和避免不需要的信息证明很困难。模型选择仍然取决于任务,Haiku/Sonnet在工具调用方面表现出色,而Gemini 2.5则适用于文档/图像处理。最后,强大的测试和评估仍然是一个重大障碍,需要对实际智能体运行进行工具化。
## 单一倾向性、自闭症和多动症:潜在的联系
费格斯·默里探讨了自闭症和多动症之间有趣的重叠,并提出一种核心认知风格——动力认知风格(KCS)——可能同时存在于两者之中。作者挑战了传统的诊断方法,这些方法将自闭症视为主要是一种社交障碍,将多动症视为注意力障碍,并认为**单一倾向性**——即强烈关注有限的兴趣,同时降低对更广泛注意力的能力——可能是两者之间的一个关键共同因素。
尽管表面上似乎矛盾(自闭症的兴趣狭窄与多动症的冲动性),默里认为这些特征可能源于相同的神经学基础,并根据个体的经历和神经认知差异表现出不同的形式。冲动性可能源于对焦点之外的意识丧失,而自闭症中的“注意力不集中”可能难以将注意力导向不感兴趣的事物。多动症甚至可能与自闭症患者的自我刺激需求有关。
作者承认需要进一步的研究,特别是关于进入“心流状态”和个体的新奇追求倾向等因素。最终,默里希望单一倾向性能够提供一个从*内部*视角理解神经多样性的框架,超越表面的表现,并可能解释自闭症和多动症诊断的高度共现性。
## libpng 1.6.51 安全发布 libpng 库已更新至 1.6.51 版本,以解决 **四个缓冲区溢出漏洞** (CVE-2025-64505, CVE-2025-64506, CVE-2025-64720, CVE-2025-65018),影响版本 1.6.0 至 1.6.50。这些漏洞是通过模糊测试和安全研究发现的,研究人员包括 Samsung-PENTEST、weijinjinnihao 和 yosiimich。 其中两个 CVE 被评为 **高危** (CVE-2025-64720 & CVE-2025-65018),涉及潜在的越界读取和堆溢出,可能导致信息泄露、拒绝服务,以及在某些配置下,任意代码执行。另外两个是 **中危** (CVE-2025-64505 & CVE-2025-64506),涉及堆缓冲区读取越界。 所有漏洞都需要用户处理恶意构造的 PNG 文件。**强烈建议用户立即升级到 libpng 1.6.51** 以减轻这些风险。 更多详细信息,包括提交链接和 GitHub 安全公告,请访问:[https://github.com/pnggroup/libpng/releases/tag/v1.6.51](https://github.com/pnggroup/libpng/releases/tag/v1.6.51)
## 明尼苏达大学数据泄露与和解方案令人失望 明尼苏达大学最近向受2021年数据泄露影响的个人提供了和解方案,该泄露影响了1989年至2021年间与大学相关的人员——包括像作者这样的校友。尽管大学并未承认有过错,但同意了500万美元的和解金,仅向受影响的个人提供30美元和24个月的暗网监控。 作者认为这项提议极具侮辱性,认为它严重低估了暴露的个人信息,例如社会安全号码和地址。除了不充分的赔偿外,大学缺乏正式道歉尤其令人沮丧。这起事件强化了一个更广泛的担忧:公共和私立机构始终将声誉和财务置于问责和数据安全之上。 作者拒绝接受和解方案,认为这会延续一种对数据泄露不够重视的体系。他们强调了大学内部的系统性问题,包括优先考虑管理成本以及缺乏强大的数据保护措施,呼吁制定更严格的法规和处罚,以激励更好的安全实践。
马云的家人最近在伦敦贝尔格莱维亚购买了一栋价值1950万英镑的豪宅,这可能预示着其财富的多元化,此前他与中国当局的关系一度紧张。 这次购买由马云的妻子张瑛于2024年10月完成,紧随马云在批评中国金融体系后重返公众视野。 专家认为,此举是应对潜在未来政治风险的“预防性”措施,反映了富裕中国个人将资产转移到海外的趋势。 此举紧随对新加坡房地产的大量投资,并可能由阿里巴巴股份出售资助。 伦敦购买的时机,在增税前匆忙完成,以及马云之前在香港和纽约的房产收购,凸显了一种国际多元化的模式。 尽管马云似乎已经与习近平总统和解——最近一次公开握手证明了这一点——但分析人士指出,他对公开评论仍然存在限制,并且有报道称他参与了中国当局的政治敏感请求。
这看起来不像可以翻译成可读中文的内容。它是一段PDF文件的数据流,包含乱码和程序指令,而不是自然语言文本。