每日HackerNews RSS

本报告旨在评估 Anthropic 的“Mythos”是否在发现安全漏洞方面具有独特能力,还是其排他性仅是出于商业决策。作者创建了一个包含九个已确认且处于模型训练截止日期之后的漏洞基准测试,用于在没有任何外部提示的情况下测试各类大语言模型识别漏洞的能力。 主要结论如下: * **模型表现**:没有任何公开模型能达到 Mythos 的水平,Mythos 成功发现了四个其他所有模型都未能察觉的漏洞。 * **模型领先者**:表现优异的模型包括 Qwen 3.6(以本地性能见长)、MiMo 和 DeepSeek,它们在较低成本下提供了具有竞争力的结果。相反,部分模型(如 Mistral 和 Google 的“agy”工具)因安全护栏限制或能力不足而失败,一些所谓的“前沿”模型表现也出奇地差。 * **智能体局限性**:使用全功能 AI 智能体并不能提高漏洞挖掘的成功率,反而往往增加了成本和干扰。 * **方法论**:尽管目前的基准测试数据尚不丰富,但研究表明,虽然现有公开模型通常不及 Mythos,但通过改进工具和提示词,它们仍有成功的潜力。 最终,作者认为,尽管 Mythos 可能在性能上处于领先地位,但其能力的“秘密”很可能源于专用工具,而非模型本身具备不可逾越的优势。

该 Hacker News 讨论帖探讨了“Fable”和“Opus 4”等先进 AI 模型的安全能力。参与者争论这些模型在网络安全方面是否确实卓越,还是其表现取决于特定的提示词。 主要观点包括: * **性能与指令的区别:** 用户指出,模型在明确指示下发现漏洞的能力,与在没有具体引导下分析整个代码库的自主审计能力之间存在区别。 * **“学者症候群”能力:** 贡献者认为,尽管这些模型在通用推理方面可能存在困难,但它们在信息安全任务中展现出了“学者般”的精通程度。 * **安全悖论:** 关于 AI 是在识别漏洞方面更强,还是在构建本质上安全的系统方面更强,各方存在分歧。虽然一些人认为模型在安全编码方面优于普通人类开发者,但另一些人指出存在不对称性,认为由人类主导的对抗性自博弈仍然是一个关键的筛选环节。 * **市场怀疑论:** 讨论涉及了对 AI 公司营销策略的怀疑,指出对 AI “核弹级”潜力的夸大宣传最终会招致严格的公众审查,这可能会给公司的声誉和 IPO 估值带来风险。

英国《金融时报》 安全验证 如需帮助,请访问 help.ft.com。对于给您带来的不便,我们深表歉意。 请启用 JavaScript 和 Cookie 以继续。 以下信息可帮助我们的支持团队解决此问题。 原因:质询 请求 ID:a1009ceb4eca9c50 状态代码:403 条款与条件 | 隐私政策 | Cookie 政策 | 管理 Cookie | 版权声明 | 奴隶制声明及政策 © 英国《金融时报》有限公司 2026。“FT”和“Financial Times”是英国《金融时报》有限公司的商标。 英国《金融时报》及其新闻报道受《FT 编辑行为准则》下的自律机制约束。

近期的一场 Hacker News 讨论反映了人们对 SpaceX 在首次拉升后的股价回落及其巨额市场估值的深切怀疑。评论者认为,该公司的估值与其真实营收极不匹配,并将其与维珍银河(Virgin Galactic)等早期“太空”公司过度的投机行为进行了负面对比。 讨论指出,人们担心这种估值更多是受“寡头”影响和政府合同控制所驱动,而非基于基本的经济价值。许多用户认为,此举是内部人士通过 Robinhood 等便捷且游戏化的交易平台,将高估的股票转嫁给散户投资者的策略。 批评人士进一步指出,埃隆·马斯克将 SpaceX、X 和 xAI 等多家企业“合并”在一起,是为了获取政府青睐并占据市场主导地位,尽管这些业务的盈利能力不足以支撑当前的股价。虽然一些用户调侃其未来潜力,但普遍观点认为,进入公开市场终将导致“因果报应”,届时现实将戳破当前的投机泡沫。

为了应对软件生态系统中日益增长的安全威胁,作者主张从根本上改变包管理器处理安全问题的方式。作者认为,不应再依赖代理注册表、Shell 包装器或中间人(MITM)拦截等脆弱的外部解决方案,而应由每个包管理器实现“全局钩子”(global hooks)。 目前的依赖冷却期和威胁情报策略等安全措施,往往是作为特定管理器内部的独立功能来实现的。作者认为,这些应当成为一个通用、原生钩子系统的实现细节,而非孤立功能。与本地包钩子不同,这些全局钩子会根据用户的全局配置,在包生命周期的各个阶段(如安装前或构建前)运行。 通过支持全局钩子,包管理器可以原生集成威胁情报、恶意软件扫描和安全策略,而无需公司构建额外且昂贵的基础设施。这种方法能够统一各生态系统(从 NPM 到 AUR 助手)的安全工作,使开发者无需为每种工具重复构建防御体系,即可保障各自的开发环境。作者呼吁社区优先向包管理器维护者提出原生全局钩子支持的需求。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 包管理器需要全局钩子 (captnemo.in) 5 点积分,evakhoury 1 小时前 | 隐藏 | 过往 | 收藏 | 讨论 帮助 | 准则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

arXivLabs 是一个框架,允许合作者直接在我们的网站上开发并分享新的 arXiv 功能。无论是个人还是机构,凡是与 arXivLabs 合作者,都已采纳并认可我们关于开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于秉持这些价值观,且仅与遵守这些价值观的合作伙伴进行合作。对能够为 arXiv 社区增值的项目有什么想法吗?了解更多关于 arXivLabs 的信息。

```Hacker News最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交登录Ultralytics YOLO26:统一的实时端到端视觉模型 (arxiv.org)9 分,由 teleforce 在 1 小时前发布 | 隐藏 | 过往 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索: ```

**YOLO26** 于 2026 年 1 月发布,是一个多功能、多任务计算机视觉模型系列,旨在执行目标检测、分割、姿态估计、分类和旋转目标检测任务。该模型提供从 Nano 到 Extra Large 共五个版本,专门针对边缘部署和低功耗硬件进行了优化。 关键架构改进包括: * **降低延迟:** 通过消除非极大值抑制(NMS),模型实现了更快的端到端推理。 * **硬件兼容性:** 移除分布式焦点损失(DFL)模块,确保对多种导出格式(如 TFLite、TensorRT、ONNX)提供更广泛的支持。 * **性能提升:** 新的损失函数(ProgLoss 和 STAL)改善了对小目标的识别能力,而受大语言模型突破性进展启发的创新 MuSGD 优化器,使训练过程更稳定、更高效。 * **效率:** 与前几代产品相比,该模型显著提升了 CPU 推理速度,使其在机器人和物联网的实时应用中表现极佳。 尽管 RF-DETR、LW-DETR 和 D-FINE 等替代方案在基准测试中具有竞争力,但 YOLO26 因其精简的边缘优先设计脱颖而出,为在资源受限环境下追求高精度与计算效率平衡的开发者提供了稳健的解决方案。

```Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 YOLO 简介 (roboflow.com) 由 teleforce 在 2 小时前发布,9 点 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:```

请启用 JavaScript 并关闭任何广告拦截器

《华尔街日报》近日报道指出,预测市场平台 Polymarket 一直在利用付费网红制作的误导性视频来吸引用户。 这一消息在 Hacker News 上引发了关于现代赌博平台掠夺性本质的热烈讨论。用户们对这些应用程序日益普及的现状表示担忧,指出它们往往通过“深色模式”(dark patterns)和信用卡“入金通道”来降低冲动投注的门槛。许多评论者将当今激进的体育博彩业与膳食补充剂行业相提并论,认为监管的匮乏使得这些公司能够模糊营销与欺诈之间的界限。 批评者认为,博彩的“游戏化”再加上其背后强大的游说活动,使得赌博行为无处不在,并对社会造成了破坏。虽然部分参与者争论这究竟是个人责任问题,还是消费者保护法规的缺失,但总体共识表现出深度的愤世嫉俗。参与者们感到沮丧的是,尽管赌博可能导致严重的现实伤害——例如财务破产和体育文化的堕落——但监管机构仍基本处于无所作为的状态,使公众极易受到掠夺性营销手段的侵害。

arXivLabs 是一个允许合作者直接在我们的网站上开发和共享 arXiv 新功能的框架。与 arXivLabs 合作的个人和组织都秉持并认可我们对开放、社区、卓越和用户数据隐私的重视。arXiv 致力于践行这些价值观,并仅与遵守这些原则的合作伙伴开展合作。您是否有为 arXiv 社区增值的项目构思?了解更多关于 arXivLabs 的信息。

Hacker News新帖 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交登录VibeThinker:通过新型 SFT+GRPO 实现推理能力超越 Opus 4.5 的 3B 参数模型 (arxiv.org)9 点 | timhigins 发布于 1 小时前 | 隐藏 | 往期 | 收藏 | 讨论帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

该资源提供来自耶鲁大学、麻省理工学院、哈佛大学和牛津大学等名校的 1,700 门免费在线课程。课程涵盖人文、经济学、历史、法律、文学、计算机科学、工程学、物理学、数学和心理学等多个学科。 其中许多课程为大型开放在线课程(MOOC)。若要免费学习,用户需在 Coursera 上选择“旁听”(Audit)选项,或在 edX 上选择“完整课程,无证书”(Full Course, No Certificate)选项。虽然课程资料本身免费,但若用户希望获取正式证书或学分,则需支付一定费用,这些费用用于支持托管平台。 无论您是想学习一门新语言、钻研高等物理,还是研究政治制度史,该数据库都提供了全面且高质量的教育内容。对于希望在不支付传统大学学费的情况下扩展知识储备的终身学习者来说,这是一个非常有价值的工具。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 来自顶尖大学的 1700 门免费在线课程 (openculture.com) 39 分,momentmaker 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 3 条评论 帮助 shostack 7 分钟前 | 下一条 [–] 有很多我想学习的东西,但我没有时间。我不需要学习资源,我需要一种能直接接入并上传到大脑的方法。 回复 helterskelter 13 分钟前 | 上一条 | 下一条 [–] https://openstax.org/higher-education ^^ 教科书的好资源 回复 mparnisari 25 分钟前 | 上一条 [–] https://www.openculture.com/free_textbooks - 我试过的免费教科书都打不开?我从计算机科学类别里选了几本。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

系统管理员通常默认使用 Redis 进行缓存,但随之产生了一个常见问题:开发人员经常开始将易失性的缓存当作持久化数据库来使用。由于 Redis 被集成到技术栈中时通常被假定为纯粹的临时存储,这种滥用在需要升级或迁移时会带来巨大的运维风险。 作者认为,**Memcached** 是纯缓存层的更优选择。与 Redis 不同,Memcached 在设计上强制采用了“无状态”架构。其客户端库旨在从容应对服务器停机,通常会忽略连接错误并返回默认值,而不是导致应用程序崩溃。此外,Memcached 的客户端哈希使集群变得简单,并消除了管理持久化状态的复杂性。 虽然 Redis 功能丰富,但其灵活性可能导致“像照顾宠物一样”的运维困境。Memcached 的简洁及其缺乏磁盘持久化的特性,使其成为那些需要高性能缓存,又想规避意外数据依赖风险的开发人员的理想低开销解决方案。最后,作者提醒我们,许多所谓的“数据库缓慢”问题实际上是查询优化问题——在实施缓存之前,请务必确保已妥善管理数据库索引。

Hacker News 上关于“赞美 Memcached”的讨论,凸显了 Memcached 的运维简洁性与 Redis 功能丰富性之间持续的争议。 该文章的批评者认为,作者采用了“稻草人谬误”,并指出许多人之所以偏爱 Redis,恰恰是因为它能自动处理集群与共识机制——而这些正是 Memcached 所忽略的。怀疑论者还反驳了文章中称 Memcached 的“静默失败”(即忽略连接错误)是一种特性的观点,认为在处理复杂应用状态时,这种行为非常危险。 相反,Memcached 的支持者认为,对于简单的缓存需求,它依然是更出色的“开箱即用”方案。他们指出,若要稳定地将 Redis 作为缓存使用,往往需要投入巨大的管理成本,例如谨慎处理持久化、配置内存策略,以及避免使用复杂的数据结构以防数据不一致。 归根结底,评论者们强调,“最好的”工具取决于具体的项目需求:Memcached 提供了一种极简且易于维护的方案,而 Redis 在提供强大功能的同时,也带来了更高的运维复杂度。此外,讨论还涉及了对现代技术博客常见乱象的沮丧情绪;一些用户质疑该原文非传统的文风是否意味着它是 AI 生成的内容。

该项目旨在让 Windows NT 3.51 和 4.0 在任天堂 GameCube、Wii 和 Wii U (vWii) 游戏机上运行。 **兼容性:** 支持的系统包括 GameCube、Wii(需 SD 卡/硬改)以及 vWii。不支持早期的 Dolphin 硬件及特定的旧式外设。该项目包含对 GameCube/N64 手柄、USB 大容量存储设备,以及通过 Flipper 硬件连接的各种 SD/IDE 接口的驱动支持。 **安装概述:** 1. 准备一份原始磁盘镜像(`.img`)和一个 NT 安装 ISO。 2. 通过 Swiss 或 Homebrew Channel 加载引导程序(`arcldr`)。 3. 使用 ARC 固件菜单对目标磁盘进行重新分区。 4. 运行 NT 安装程序,并在提示时手动选择相应的硬件抽象层(HAL)和大容量存储驱动程序。 5. 在文本安装模式下,手动配置键盘和指点设备以确保兼容性。 **技术说明:** * 必须使用 NT 3.51 (RTM+) 版本;NT 3.5 不兼容。 * 在 SD/EXI 设备上的性能受限于硬件总线速度。 * 开发过程需要使用 `devkitPPC` 编译引导程序,并使用特定的 MSVC/PPC 工具链来构建 HAL 和驱动程序。 * 为解决 NT 在硬件检测方面的局限性,项目提供了详细的设置指南,包括具体的构建步骤和磁盘初始化的故障排除方法。

Hacker News | 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 | 登录 GameCube/Wii 版 Windows NT (github.com/wack0) 4 分,由 zdw 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 1 条评论 | 帮助 ranger_danger 11 分钟前 [–] > wack0 那不就是因为任天堂“Gigaleaks”泄密事件被抓的那个孩子吗?后来还辩称是心理健康问题“导致他这样做”的? 回复 指导方针 | 常见问题 | 列表 | API | 安全 | 法律 | 申请加入 YC | 联系我们 搜索:

更多

联系我们 contact @ memedata.com