每日HackerNews RSS

Ornith-1.0 是一个专为智能体编码任务优化的全新开源模型系列,涵盖了从 9B 参数的轻量化边缘部署单元到 397B 参数的前沿规模模型。该系列基于 Gemma 4 和 Qwen 3.5 构建,在 SWE-Bench Verified 和 Terminal-Bench 2.1 等主流基准测试中表现出色,其中 397B 版本足以媲美 Claude Opus 4.7。 Ornith-1.0 的突破性在于其自我完善的训练框架。模型不再依赖人工编写的代码工具,而是同步进化其问题解决策略以及引导任务的特定“框架”(编排逻辑)。通过强化学习,模型能够不断优化这些框架,从而引导出更高奖励的搜索路径。 为防止奖励破解,该框架采用了三层防御机制:不可变的运行环境边界、确定性的工具使用监控,以及作为否决权执行者的冻结 LLM 评判员。此外,模型通过采用带有滞后标记加权的流水线强化学习策略,有效处理了长时、异步的训练回放。这种方法使 Ornith-1.0 能够在无需人工干预的情况下,实现高质量、自动化的编码策略,并持续自我提升,从而在各种设备规模下提供强大且高效的性能。

Hacker News 的讨论聚焦于 **Ornith-1.0**,这是一款专为智能体编程设计的自构建(self-scaffolding)大语言模型。 用户基准测试(专门测试模型发现安全漏洞的能力)显示结果参差不齐。虽然 Ornith 在工具受限(仅能使用 read/grep/ls)时表现不佳,但在获得完整的 Shell 和 Python 权限后,其性能翻了一番,这证实了它旨在通过构建工具来解决问题的设计初衷。然而,据报道,其表现仍不及 Qwen AgentWorld 模型。 争议的一个重要焦点在于该模型的性能声明。用户澄清称,Ornith 9B 是基于 Qwen 3.5 的微调版本,而关于它能媲美 35B 级别模型的说法遭到了质疑。尽管一些用户认为 35B 版本的 Ornith 能力尚可,但其他人指出它无法超越 DeepSeek 等行业领先者。此次对话还引发了一场技术辩论:即“自构建”方法究竟是一种真正的架构创新,还是仅仅以代码执行为核心的复杂提示词优化形式。

特朗普政府正通过积极运用旨在针对所谓“反法西斯”行动者的反恐备忘录(NSPM-7),升级对异见人士的打压。这一策略在近期“草原地带”(Prairieland)案中八名被告被判处总计450年监禁的事件中表现得尤为明显。值得注意的是,丹尼尔·“德斯”·桑切斯·埃斯特拉达(Daniel "Des" Sanchez Estrada)因运送政治宣传册而被判处30年监禁。这一判决基于政府的一种理论,即持有“极端”文学作品意味着要为持有相似意识形态的其他人的罪行承担共犯责任。 批评人士认为,这代表了对美国宪法第一修正案的危险侵蚀,即意识形态的认同正日益被与犯罪企业混为一谈。通过将持有和分享不受欢迎的信息定为犯罪,政府正为美国人制造一种“第22条军规”式的困境:接触有争议的思想会招致调查,而试图隐瞒这些信仰的证据又可能导致因妨碍司法而被起诉。 随着美国司法部暗示“草原地带”案仅仅是一个开始,政府将政治对手和媒体贴上“内部敌人”标签的言论表明,其打击范围正在扩大。这威胁到受保护的言论和政治表达,正将国家推向一个独立思考被视为违禁品的未来。

近期一篇《拦截》(The Intercept)报道详述了一名男子因运输“煽动性小册子”(zines)而被判处 30 年监禁的案件。此案引发了激烈的辩论,尤其是在 Hacker News 上,议题集中在言论自由、政府对“国内恐怖主义”指控的运用,以及司法系统的公正性等层面。 控方支持者认为,该判决并非仅仅针对运输小册子,而是针对妨碍司法公正。他们主张,被告曾协助隐匿与一起针对美国移民及海关执法局(ICE)拘留中心协同攻击相关的证据。在那次事件中,有人利用烟花引诱急救人员进入埋伏圈,导致一名警员被枪击。支持者认为这属于重罪共谋,足以支持对所有涉案人员处以重刑。 然而,批评者认为,这一判决是威权主义的危险升级。他们主张,将和平异见者贴上“恐怖分子”的标签,使政府能够规避宪法保护。他们认为妨碍司法公正的指控纯属牵强附会,并指出政治文献并不构成犯罪证据;控方是在利用宽泛的“共谋”法律,来惩罚那些甚至并未出现在枪击现场的个人。这场讨论凸显了社会在政治暴力角色以及政府镇压异见权力问题上日益加深的鸿沟。

由于一次灾难性的安全故障,欧洲各地近百万份护照和驾驶执照在公共互联网上泄露了数月之久。这些属于 Nefos 用户和各类大麻俱乐部成员的证件,被存储在没有加密、密码或身份验证保护的网页服务器上。任何拥有直接链接的人都可以访问这些敏感的身份证明文件。 与泄露的密码不同,身份证明文件无法轻易重置。此次泄露带来了长期性的身份盗用、欺诈和账户被劫持风险,犯罪分子可能会在未来多年内利用这些被盗数据。 安全研究员 Sammy Azdoufal 发现了这一漏洞。此事凸显了一个令人不安的趋势:企业在收集海量敏感数据用于“年龄验证”的同时,却将基本的安全实践视为可选项。该事件反映了数据管理方面的系统性失败,“配置错误”导致了近百万公民的隐私信息被公之于众。虽然涉事服务器现已下线,但泄露的具体时间窗口仍不清楚,这使得受害者几乎没有补救措施,并面临着长期且持续的被侵害风险。

Robert X. Cringely 对行业内普遍持有的观点提出了挑战。该观点由 Anthropic 的 Dario Amodei 推广,认为增加算力的“规模化”最终将解决人工智能的幻觉问题。Cringely 认为,这种“规模化假说”为科技巨头提供了一张便捷的“通行证”,使他们能够为数十亿美元的巨额投资正名,同时推迟解决人工智能可靠性这一根本性技术挑战。 为了证明规模化并非唯一的出路,Cringely 引用了他自己的公司 2Brains, Inc. 的案例。该公司通过架构设计——使用普通处理器和验证系统——而非暴力计算,解决了幻觉问题。 他的批评指出,在规模化上投入万亿美元的赌注是有缺陷的。要么规模化无法完全根除幻觉,这意味着行业正在将巨额资金浪费在无效的策略上;要么它最终会通过巨额支出实现本可以通过更优秀、更高效的设计就能完成的目标。Cringely 最终指出,该行业被一种“便捷的教条”所蒙蔽,这种教条崇尚花钱而非工程创新。随着这些巨额投资的账单陆续到期,他警告说,“更多算力等于更高智能”的假设,可能会成为该领域历史上最昂贵的误判。

抱歉。

以下是内容摘要: 琥珀色且对夜空友好的照明方案,为目前社区普遍安装的刺眼白色 LED 灯提供了一种经济、高效且实用的替代选择。光污染正日益严重,但我们可以通过倡导更合理的照明政策来重拾星空。 正如社会曾共同努力限制公共场所吸烟一样,现在我们也必须齐心协力,敦促当地官员选择琥珀色照明,而非造成光污染的白色 LED 灯。作者鼓励读者立即采取行动,联系城镇政府并利用所提供的资源(包括信件样本和指南)来协助减少光污染。为了获得更多启发,作者建议观看斯里拉姆·穆拉利(Sriram Murali)执导的纪录片《拯救黑暗》(*Saving the Dark*)预告片。通过共同发声,我们可以在有害照明被永久安装之前,守护好我们的夜空。

Hacker News 上关于“暗空照明”(savingourstars.org)的讨论帖引发了一场关于现代户外照明对生态和生理影响的热烈辩论。 许多参与者支持该倡议,指出过度的光污染会扰乱昼夜节律、导致行人眩目,并制造出可能增加而非减少犯罪的刺眼阴影。支持者主张从高色温的强光蓝色 LED 转向琥珀色、向下准直的照明,以恢复夜空并改善人类和野生动物的健康。 然而,讨论也突显了显著的实际障碍。用户表示,该链接网站似乎维护不善,存在链接失效且缺乏购买高质量消费级灯具的明确指导。另一些人则对光污染与公共安全之间的权衡提出了担忧,他们认为虽然“暗空”原则在农村地区很理想,但在高交通流量的城市环境中可能并不切实际,因为在这些地方,能见度对司机和行人的安全至关重要。归根结底,尽管社区在减少光污染的“价值”上达成了强烈共识,但在技术执行以及如何平衡个人舒适度与公共安全的可行性上,人们仍存在分歧。

本文对苹果神经网络引擎(ANE)进行了全面的逆向工程技术分析。ANE 是集成在苹果 A 系列和 M 系列芯片中的矩阵加速器。研究涵盖了从 A11/M1 到 A18/M5 的硬件代际演进,详细介绍了 ANE 的架构,包括其数据通路、权重压缩技术、固件、内核驱动程序及指令协议。 通过结合硬件直接测量(主要针对 M1 和 M5 芯片)以及对私有运行时和编译器的静态分析,作者确定了该引擎的性能边界与运行特性。本指南明确指出,虽然 ANE 通常仅限于苹果的 Core ML 框架使用,但从用户空间直接访问该硬件是可行的。不过,作者提醒这种底层方法未经官方文档支持,且对版本高度敏感;它仅适用于研究和基准测试,不应用于生产软件。总之,这项工作为理解驱动苹果自研芯片机器学习加速的专有机制提供了透明的视角。

最近 Hacker News 上的一场讨论对一篇名为《Apple Neural Engine: Architecture, Programming, and Performance》(Apple 神经网络引擎:架构、编程与性能)的 ArXiv 论文提出了批评。评论者们的共识非常负面,许多人将其贴上了“AI 垃圾内容”(AI slop)的标签。 批评者认为,该论文充斥着不地道的术语、重复的结论和糟糕的结构,暗示其缺乏人类撰写的研究应有的深度。除了写作风格之外,一些用户还指出了技术上的不准确性和背景信息的缺失,并指出该文档未能解释如何针对大语言模型等任务有效利用该硬件。 尽管该论文试图对 M1 神经网络引擎的性能和计算效率进行技术性的“屋顶线”(roofline)分析,但社区认为其毫无参考价值。那些寻求了解苹果微架构真实见解且感到失望的读者,纷纷转向了更可靠的来源,例如对 M4 神经网络引擎的逆向工程分析,或是关于在 Apple Silicon 上运行 ModernBERT 等模型的实用指南。总的来说,这篇帖子对那些以数量优先于清晰度和实质内容的劣质 AI 生成技术文档提出了警告。

Carson Gross 反思了他与人工智能之间矛盾的关系,并以其项目 *hyperscript* 最近的一次错误修复为例,说明了 AI 的两面性。 尽管 Claude 在定位解析回归(parsing regression)的根本原因和生成全面测试用例方面表现出色,但在提供架构合理的解决方案时却显得力不从心。AI 最初的建议往往是“投机取巧”的,引入了不必要的技术债务。Gross 避免了“魔法师的学徒”式的问题(即开发者在不理解系统的情况下盲目依赖 AI),他利用自己对 *hyperscript* 的深厚理解,引导 AI 转向解析器中更简洁、现有的机制。 Gross 总结道,AI 是一个强大的力量倍增器,尤其是对于那些在记忆力或精力方面可能遇到瓶颈的资深开发者而言。然而,他警告称,过度依赖 AI 可能导致“智力迟钝”。高效开发的关键在于保持“人在回路”的方法:利用 AI 进行繁重的调查和测试工作,同时保留必要的专业知识,以要求并验证优雅的解决方案。他认为,开发者必须充当监督 AI 的“魔法师”,而不是为了快速修复而牺牲系统完整性的被动“学徒”。

这场围绕 Carson Gross 关于利用人工智能进行软件开发的文章所展开的讨论,达成了共识:尽管大语言模型(LLM)擅长处理模板化代码和快速实现,但在高层设计、批判性思维和长期的架构整合方面仍存在不足。 辩论的要点包括: * **架构缺陷:** 批评者认为 LLM 缺乏“世界模型”,这导致它们倾向于选择快速、“临时拼凑”的解决方案,而非可持续、优雅的设计。这可能会加速技术债务的积累。 * **流程的力量:** 支持者认为,当工作流经过结构化设计时(例如使用“规划模式”、将任务规划与执行分离,或通过苏格拉底式对话强迫模型考虑更广泛的限制),LLM 的表现会显著提升。 * **技能退化与效率:** 关于依赖人工智能是否会削弱人类智力,存在争议。一些人认为 AI 阻碍了初期的学习过程,而另一些人则认为它是一种灵活的工具,用户可以将其“塑造”以满足特定需求。 最终,参与者普遍认为,虽然人工智能是一个强大的助手,但仍需要人类作为“品味把控者”来指导决策,并确保最终产出在结构上是稳健的。

身份 许可人名称:拥有并发布许可作品的个人或实体。 版权年份: 司法管辖区(第 8.1 节): 准据法:选择常见司法管辖区…… 美国特拉华州(广泛的商业先例) 美国佛罗里达州 新加坡(亚太地区) 爱沙尼亚(欧盟) 英格兰和威尔士 自定义…… 自定义准据法文本: 审判地(法院):拥有专属管辖权的城市及州/国家。 通知(第 8.7 节)——可选: 法律通知联系地址(可选): 单独发布在您的网站或 README 文件中;默认不嵌入在许可证正文中。 发布元数据——用于页眉和声明: 版本号: 首次公开发布日期: 变更日期:自动设置为该日期后的四年。 许可证 URL(可选): 分级表 URL(可选):

关于“ACL 1.0”(一种针对人工智能时代的新型“源代码可用”许可证),Hacker News 上的讨论凸显了开发者社区的深度质疑。 虽然一些人赞赏创作者诚实地将该许可证标记为“源代码可用”而非“开源”,但批评者认为该模式存在根本性缺陷。一个主要争议点在于,此类许可证无法有效限制人工智能训练:如果训练在法律上被视为合理使用,则该许可证毫无意义;如果它构成侵权,该许可证也无法解决根本的法律冲突。 评论者还指出,该许可证创造了一种“两头不讨好”的局面。自由软件倡导者拒绝它,因为它本质上仍是私有的;企业也不太可能采用它,因为它无法提供任何竞争优势。此外,怀疑论者认为,软件的价值正日益与产品架构挂钩,而非源代码,而人工智能现在可以轻易复制架构。归根结底,舆论共识认为,试图通过许可来控制人工智能的使用是一种徒劳的方法,既无法满足私有软件开发者的需求,也无法得到开源社区的认可。

这份草稿反对在 CSS 中列出详尽且仅限本地字体的做法。由于网络、安全或用户自定义偏好等原因,Web 字体可能会加载失败,因此作者提倡采用“通用优先”的方法。 主要建议包括: * **简化字体栈:** 停止枚举数十种本地字体(如 Helvetica 或 Arial)。通用字体族(`sans-serif`、`serif`、`monospace`)通常会自动解析为高质量的系统默认字体。 * **优先使用通用等宽字体:** 始终包含 `monospace` 关键字,但需注意一个旧版浏览器的 Bug,即 `font-family: monospace` 可能会导致文字缩小。解决方法是使用 `font-family: monospace, monospace`(或添加一个占位字体)。 * **避免使用 UI 字体:** 作者认为 `system-ui` 和 `ui-*` 属性在很大程度上是误导性的,认为它们是为简短的界面文本而非长篇内容设计的,且已被开发者广泛滥用。 最终,作者建议 Web 开发者应更多地信任浏览器默认设置,避免使用臃肿且不可靠的字体栈,转而采用简洁、语义化的声明。

上游连接错误或在标头发送前断开/重置。重置原因:远程连接失败,传输失败原因:延迟连接错误:连接被拒绝。

拟议的“.self”顶级域名(TLD)旨在作为一种以人为本、非营利的基础设施,用于个人自托管。该项目的目标是通过向用户提供免费域名及电子邮件等相关服务,来简化家庭服务器的搭建过程。该倡议强调“一人一域名”的原则,以防止域名抢注和投机行为。 然而,Hacker News 社区对此表示了强烈质疑。批评者认为: * **可行性:** 从技术上实现“一人一域名”的监管难度很大,且可能具有侵入性,往往需要用户提供难以接受的身份验证。 * **安全性:** 一个中心化的“自托管”顶级域名可能会使攻击者更容易锁定目标,相当于给每个网站都打上了“不安全的个人业余项目”的标签。 * **必要性:** 许多用户质疑,在现有解决方案或传统域名已经可以支持自托管的情况下,为什么还需要一个新的顶级域名。 * **基础设施:** 该项目面临极高的财务门槛,包括巨额的 ICANN 申请费和持续的维护成本,这引发了人们对其作为公共产品的长期可持续性的担忧。 尽管社区认可其赋权数字主权的目标,但许多人认为,与现有的技术替代方案相比,该项目是一个不必要且复杂的“支线任务”。

更多

联系我们 contact @ memedata.com