每日HackerNews RSS

RFC 10008 引入了 **QUERY** HTTP 方法,旨在解决现有方法在处理复杂数据检索时的局限性。 传统上,开发人员使用带有 URL 参数的 **GET** 方法,但在面对复杂、嵌套或大型查询时,由于字符限制和可读性差,这种方式会产生问题。虽然从技术上讲,在 **GET** 请求中发送请求体是可能的,但通常不建议这样做,因为许多服务器和代理对这类请求的处理方式不一致,甚至会拒绝此类请求。另一方面,将 **POST** 用于查询在语义上是不正确的;作为一种非幂等方法,它阻碍了自动缓存和安全的重试机制。 **QUERY** 方法通过提供一种支持请求体的安全、幂等替代方案弥补了这一空白。它允许进行复杂的过滤,且没有 POST 的语义负担,也不受 GET 的约束。 然而,其普及仍面临挑战。目前,浏览器、代理服务器和 Web 服务器对该方法的支持有限;而且与 GET 不同,QUERY 请求无法轻松地通过 URL 进行收藏或共享。因此,对于简单的、可共享的请求,标准的 GET 方法仍然是最佳选择;而 QUERY 则应保留用于现有方法无法满足的复杂用例。

拟议的 **HTTP QUERY** 方法旨在提供一种标准化的方式来执行需要请求体的只读请求,从而解决 `GET` 方法的一个常见局限。 目前,尽管一些开发人员会在 `GET` 请求中使用请求体,但这种做法并不被推荐,因为许多 Web 服务器、代理和 WAF(Web 应用防火墙)会剥离 `GET` 请求中的请求体,导致行为不一致并带来潜在的安全风险。 支持者认为 `QUERY` 比带请求体的 `GET` 更具优势,原因有二: 1. **语义明确:** 它明确将请求定义为安全的、幂等的且可缓存的,从而为中间件(如 CDN)提供关于如何处理该请求的明确指令。 2. **标准化:** 与其强行对现有的 `GET` 方法进行非标准化的改动(这会导致遗留系统出现未定义的行为),不如引入一种新方法,以实现明确的支持和整洁的错误处理(例如返回 `405 Method Not Allowed`)。 批评者则认为 `QUERY` 是多余的,他们建议开发人员继续使用 `POST`,或者主张行业应直接标准化带请求体的 `GET`,尽管这样做可能会引发广泛的兼容性问题。

**Lume** 是一款基于 Rust 开发的开源混合搜索引擎,专为那些对智能体检索系统(agentic retrieval systems)透明度有高要求的开发者而设计。与“黑箱”搜索方案不同,Lume 的构建原则是可审计性:每一个排序得分都是可计算、可命名且可调节的。 该引擎采用分层架构,利用三个独立的基元: 1. **字段感知 BM25 (Field-aware BM25):** 一个高度可调的词法核心,能够区分标题与正文,并支持长度归一化和平滑得分选项。 2. **稠密向量 (Dense Vectors):** 通过本地 GTR-T5 嵌入(使用 Shivvr)进行语义搜索,为词汇鸿沟提供召回扩展。 3. **显著性评分知识图谱 (SKG):** 一种结构化信号,使用基于 z-score 的显著性而非简单的共现关系来映射实体关联,从而有效地优先考虑有意义的关联,而非“杂乱”的中心节点。 Lume 通过两阶段剪枝过程优化性能:使用 **Roaring Bitmaps** 进行快速收集,以及使用 **质因数哥德尔签名 (prime-factored Gödel signatures)** 进行高效的实体过滤。 通过公开整个检索流水线(从查询规划到最终混合评分),Lume 允许用户诊断“失败”的搜索(如由专有名词偏差或上下文压力引起的搜索),用户可以通过调整特定参数并实时检查引擎的决策逻辑来解决这些问题。

抱歉。

请启用 JavaScript 和 cookie 以继续

**AdBuster 2.0 PRO** 是一款轻量级且注重隐私的 Windows 应用程序,它能通过检测并降低嘈杂广告的音量,自动稳定电视音频。 与基础的音量限制器不同,AdBuster 使用了先进的“CEPA”(情境事件模式分析)引擎,并结合了离线机器学习模型。该系统模拟人类的推理能力,能够区分节目的自然动态与干扰性的音量激增,从而确保音量调节平滑且仅在必要时触发。 **主要功能:** * **隐私至上:** 100% 本地运行,无需联网、云端支持或遥测。 * **智能自动化:** 采用多阶段流水线处理——包括实时音频分析、基于机器学习的模式验证以及由 CEPA 驱动的决策系统——以提供精确且具有情境感知能力的音量控制。 * **Broadlink 红外集成:** 通过 Broadlink 红外发射器自动向电视发送“音量调大”或“音量调小”指令,无需任何手动干预。 * **高度可配置:** 支持调节阈值、安全限制及防误触保护,防止过度调节。 AdBuster 2.0 PRO 是一款便携且易于使用的解决方案,适合希望在电视广播中彻底消除音量突变,同时又想完全掌控个人数据的用户。

本报告旨在评估 Anthropic 的“Mythos”是否在发现安全漏洞方面具有独特能力,还是其排他性仅是出于商业决策。作者创建了一个包含九个已确认且处于模型训练截止日期之后的漏洞基准测试,用于在没有任何外部提示的情况下测试各类大语言模型识别漏洞的能力。 主要结论如下: * **模型表现**:没有任何公开模型能达到 Mythos 的水平,Mythos 成功发现了四个其他所有模型都未能察觉的漏洞。 * **模型领先者**:表现优异的模型包括 Qwen 3.6(以本地性能见长)、MiMo 和 DeepSeek,它们在较低成本下提供了具有竞争力的结果。相反,部分模型(如 Mistral 和 Google 的“agy”工具)因安全护栏限制或能力不足而失败,一些所谓的“前沿”模型表现也出奇地差。 * **智能体局限性**:使用全功能 AI 智能体并不能提高漏洞挖掘的成功率,反而往往增加了成本和干扰。 * **方法论**:尽管目前的基准测试数据尚不丰富,但研究表明,虽然现有公开模型通常不及 Mythos,但通过改进工具和提示词,它们仍有成功的潜力。 最终,作者认为,尽管 Mythos 可能在性能上处于领先地位,但其能力的“秘密”很可能源于专用工具,而非模型本身具备不可逾越的优势。

这段 Hacker News 讨论主要围绕 Anthropic 发布随后又撤回其“Fable”模型(“Mythos”模型的消费级版本)展开。用户们争论 Fable 究竟代表了 AI 能力的真正“跨越式提升”,还是仅仅得益于出色的营销和“氛围编码(vibe coding)”。 **主要议题包括:** * **感知能力:** 许多用户反馈 Fable 在空间推理、持久性以及复杂的多轮编程任务中,表现显著优于 Opus 4.8 等现有模型。然而持怀疑态度者认为,这些反馈大多是轶事证据且易受认知偏差影响,模型风格带来的“新鲜感”可能造成了智能水平更高的错觉。 * **“削弱(Nerfing)”现象:** 用户普遍感到沮丧的一点是,他们认为模型会随着时间推移被“削弱”或降级,这可能是为了控制计算成本,或是为了引导用户转向更新、更昂贵的版本。 * **安全与基准测试:** 讨论中提到了一个评估模型识别安全漏洞能力的基准测试项目。虽然部分模型表现出潜力,但参与者指出,目前的评估方法存在成本高昂、测试参数不一致的问题,且难以将“原始智能”与配套框架或代理系统的质量区分开来。 * **AI 交互的本质:** 对话凸显了用户群体的差异:一部分用户将 AI 视为纯粹的工具(追求简洁、逻辑导向),而另一部分用户则采取协作式的“同事”语调,许多人认为后者往往能产生更好的结果。

英国《金融时报》 安全验证 如需帮助,请访问 help.ft.com。对于给您带来的不便,我们深表歉意。 请启用 JavaScript 和 Cookie 以继续。 以下信息可帮助我们的支持团队解决此问题。 原因:质询 请求 ID:a1009ceb4eca9c50 状态代码:403 条款与条件 | 隐私政策 | Cookie 政策 | 管理 Cookie | 版权声明 | 奴隶制声明及政策 © 英国《金融时报》有限公司 2026。“FT”和“Financial Times”是英国《金融时报》有限公司的商标。 英国《金融时报》及其新闻报道受《FT 编辑行为准则》下的自律机制约束。

抱歉。

为了应对软件生态系统中日益增长的安全威胁,作者主张从根本上改变包管理器处理安全问题的方式。作者认为,不应再依赖代理注册表、Shell 包装器或中间人(MITM)拦截等脆弱的外部解决方案,而应由每个包管理器实现“全局钩子”(global hooks)。 目前的依赖冷却期和威胁情报策略等安全措施,往往是作为特定管理器内部的独立功能来实现的。作者认为,这些应当成为一个通用、原生钩子系统的实现细节,而非孤立功能。与本地包钩子不同,这些全局钩子会根据用户的全局配置,在包生命周期的各个阶段(如安装前或构建前)运行。 通过支持全局钩子,包管理器可以原生集成威胁情报、恶意软件扫描和安全策略,而无需公司构建额外且昂贵的基础设施。这种方法能够统一各生态系统(从 NPM 到 AUR 助手)的安全工作,使开发者无需为每种工具重复构建防御体系,即可保障各自的开发环境。作者呼吁社区优先向包管理器维护者提出原生全局钩子支持的需求。

arXivLabs 是一个框架,允许合作者直接在我们的网站上开发并分享新的 arXiv 功能。无论是个人还是机构,凡是与 arXivLabs 合作者,都已采纳并认可我们关于开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于秉持这些价值观,且仅与遵守这些价值观的合作伙伴进行合作。对能够为 arXiv 社区增值的项目有什么想法吗?了解更多关于 arXivLabs 的信息。

近期的一场 Hacker News 讨论聚焦于 Ultralytics YOLO26 的发布,这是该系列实时计算机视觉模型中的最新迭代。讨论帖指出,Ultralytics 已将其命名规则从顺序版本号改为基于年份的系统。 然而,此次发布在技术社区中引发了质疑。批评者认为,论文中关于“最强 AP-延迟权衡”的性能声明具有误导性。评论者指出,作者为了使性能图表看起来更具优势,特意忽略了诸如 RF-DETR 等性能更强的新模型,尽管这些模型在论文引言中已被提及。 除了技术上的争论,用户还就 YOLO 命名规则迅速且令人困惑的演变进行了调侃,指出该品牌已从特定的版本号演变成了机器学习社区中近乎“梗”一般的存在。

**YOLO26** 于 2026 年 1 月发布,是一个多功能、多任务计算机视觉模型系列,旨在执行目标检测、分割、姿态估计、分类和旋转目标检测任务。该模型提供从 Nano 到 Extra Large 共五个版本,专门针对边缘部署和低功耗硬件进行了优化。 关键架构改进包括: * **降低延迟:** 通过消除非极大值抑制(NMS),模型实现了更快的端到端推理。 * **硬件兼容性:** 移除分布式焦点损失(DFL)模块,确保对多种导出格式(如 TFLite、TensorRT、ONNX)提供更广泛的支持。 * **性能提升:** 新的损失函数(ProgLoss 和 STAL)改善了对小目标的识别能力,而受大语言模型突破性进展启发的创新 MuSGD 优化器,使训练过程更稳定、更高效。 * **效率:** 与前几代产品相比,该模型显著提升了 CPU 推理速度,使其在机器人和物联网的实时应用中表现极佳。 尽管 RF-DETR、LW-DETR 和 D-FINE 等替代方案在基准测试中具有竞争力,但 YOLO26 因其精简的边缘优先设计脱颖而出,为在资源受限环境下追求高精度与计算效率平衡的开发者提供了稳健的解决方案。

抱歉。

请启用 JavaScript 并关闭任何广告拦截器

《华尔街日报》近日报道指出,预测市场平台 Polymarket 一直在利用付费网红制作的误导性视频来吸引用户。 这一消息在 Hacker News 上引发了关于现代赌博平台掠夺性本质的热烈讨论。用户们对这些应用程序日益普及的现状表示担忧,指出它们往往通过“深色模式”(dark patterns)和信用卡“入金通道”来降低冲动投注的门槛。许多评论者将当今激进的体育博彩业与膳食补充剂行业相提并论,认为监管的匮乏使得这些公司能够模糊营销与欺诈之间的界限。 批评者认为,博彩的“游戏化”再加上其背后强大的游说活动,使得赌博行为无处不在,并对社会造成了破坏。虽然部分参与者争论这究竟是个人责任问题,还是消费者保护法规的缺失,但总体共识表现出深度的愤世嫉俗。参与者们感到沮丧的是,尽管赌博可能导致严重的现实伤害——例如财务破产和体育文化的堕落——但监管机构仍基本处于无所作为的状态,使公众极易受到掠夺性营销手段的侵害。

更多

联系我们 contact @ memedata.com