每日HackerNews RSS

## BaNEL:从具有挑战性的生成任务中的失败中学习 许多关键的机器学习问题——例如定理证明或药物发现——都极其困难,其特征是**极其稀疏的奖励**(几乎没有成功的案例)和**高昂的奖励评估成本**。传统的后训练方法在这种情况下难以奏效,常常退化为随机搜索。 这项研究引入了**BaNEL(贝叶斯负面证据学习)**,这是一种新颖的算法,旨在*仅*从失败尝试中学习,同时最大限度地减少对昂贵奖励评估的需求。BaNEL通过学习失败的生成模型来解决“零奖励问题”。该模型识别不成功尝试中的模式,使系统能够避免重复错误并集中探索。 本质上,BaNEL学习什么*不起作用*,并利用这些知识来指导未来的尝试。实验表明,BaNEL在对抗性攻击和复杂推理问题(GSM8K)等任务中,显著优于现有方法——包括新颖性奖励方法。重要的是,BaNEL的性能随着用于建模失败的计算资源而提高,用计算换取奖励效率。 核心思想是通过即使在正面示例几乎不存在的情况下也能学习,来解锁生成模型真正的新能力——从失败中学习是推动人工智能边界的关键。

## 从解决问题中的失败中学习 一个Hacker News的讨论围绕着卡内基梅隆大学的一篇关于从失败中学习以解决难题的研究论文展开。一个关键要点是了解*有人*已经解决了问题的重要性——仅仅知道存在解决方案就可以解锁理解。 对话延伸到将这个概念应用于现实世界的挑战,例如建立一家成功的公司。虽然许多人知道成功是可能的,但高失败率(估计为8-9/10)强调了重复尝试或避免重蹈覆辙的必要性。一些评论员将其与心理障碍相提并论,例如四分钟英里,表明可以克服感知的限制。 另一些人质疑这项研究在药物发现等领域的适用性,而一些人则批评某些研究目标的动机。一个反复出现的主题是高效搜索庞大问题空间的重要性,以及人工智能/机器学习改善这一过程的潜力。讨论还涉及营销和认知在定义成功中的作用。

GNOME Mutter 最终完成了合并,完全移除 X11 后端,使 GNOME 严格专注于基于 Wayland 的环境。Bilal Elmoussaoui 四个月前的合并请求已被合并。该合并请求总结为:“移除 X11 后端,完全移除整个 x11 后端。” 在 GNOME 49 版本中默认禁用 X11 路径后,代码将在 GNOME 50 版本中被彻底删除。随后,此次合并旨在更好地使 Mutter 适应移除的 X11 后端。GNOME 50 将继续支持 XWayland 客户端(应用程序/游戏),但未来将严格用于基于 Wayland 的桌面会话。

## GNOME 放弃 X11 支持:摘要 GNOME 的 Mutter 窗口管理器已完全移除其 X11 后端,完全致力于 Wayland。此举虽然可能简化开发,但也引发了 Linux 社区内的争论。 一些用户表达了沮丧,指出 Wayland 兼容性仍然存在问题——特别是与辅助工具、远程桌面软件(如 XRDP)和密码自动填充(如 KeepassXC)的兼容性。人们也对 GNOME 的开发方式表示担忧,一些人指责开发者将他们的愿景置于社区反馈之上,并破坏了现有功能。 然而,其他人则欢迎这一变化,指出 Wayland 在显示缩放方面的改进,并认为竞争将推动 Linux 桌面空间的创新。一些长期 Wayland 用户报告了稳定的体验,同时承认并非所有人都能顺利过渡。 这场讨论凸显了开源开发中反复出现的矛盾:在创新与向后兼容性以及社区需求之间取得平衡,以及项目发生重大分歧时可能出现的碎片化。最终,鼓励用户选择最适合他们需求的桌面环境,例如 Cinnamon 提供更传统的体验。

arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。

## Kosmos:用于科学发现的人工智能 - 批判性观点 一篇关于Kosmos的论文,这是一款用于自主科学发现的人工智能,在Hacker News上引发了讨论。虽然该人工智能成功地复现了现有数据集的结论——与人类科学家的发现相符——但一些评论员质疑这是否真正构成“发现”。 核心争论在于所使用数据集的策划性质。批评者指出,这些数据集的构建是为了*支持*特定的假设,这意味着Kosmos并非从零开始。然而,其他人认为,快速复制科学结果*本身*就是一项有价值的进步,可以加速研究步伐。 讨论还涉及了对人工智能期望的变化,以及它可能成为一种强大的工具,而不是人类科学家的替代品。一个相关的项目Sakana.ai也被提及,此前已经取得了类似的结果。最终,共识倾向于Kosmos是对科学过程的一个有希望的,但目前*被过度宣传*的贡献。

迈克尔·伯里,这位以预测2008年房地产危机(《大空头》)而闻名的投资者,现在正在押注当前人工智能繁荣的破灭。他的基金Scion Asset Management最近披露了大量“看跌期权”购买——押注股票将下跌,总额超过10亿美元,涉及英伟达和帕兰蒂尔这两家领先的人工智能公司。 此举表明伯里认为人工智能股票被高估,并可能处于泡沫之中,这反映了对科技估值膨胀和市场过度依赖少数大型公司的担忧。最近的市场下跌,包括纳斯达克自8月以来最糟糕的一天,似乎与这些焦虑相符。 尽管帕兰蒂尔报告了强劲的收益,但其股价仍大幅下跌,凸显了投资者的敏感性。伯里重返社交媒体,发布了《大空头》中的一张照片,并附上了一条关于泡沫的神秘信息,这先于美国证券交易委员会的备案,放大了影响。尽管伯里偶尔也会做出错误的判断,但他的言论在华尔街上仍然具有重要影响力,引发了辩论,并加剧了对人工智能市场可持续性的关注。

## 迈克尔·伯里做空英伟达和帕兰蒂尔:摘要 以成功押注2008年房地产市场崩盘而闻名的迈克尔·伯里,据报道已采取新的空头头寸——做空英伟达和帕兰蒂尔。根据美国证券交易委员会(SEC)的文件,他在英伟达购买了价值1.876亿美元的看跌期权,在帕兰蒂尔购买了价值9.12亿美元的看跌期权。然而,评论员指出,13F报告显示的是期权的*价值*,而不是实际支付的权利金,这意味着实际的赌注规模可能更小。 讨论的中心是期权交易的复杂性以及伯里时机判断失误可能造成的重大损失。维持空头头寸会产生成本(希腊字母Theta衰减),并且需要准确预测价格下跌。 许多用户警告不要盲目追随伯里,指出他在《大空头》之后的业绩参差不齐,以及空头交易固有的风险。 对话还涉及帕兰蒂尔的关联以及更广泛的AI市场炒作,质疑当前的估值是否合理。最终,该讨论强调了这些赌注的投机性以及理解相关风险的重要性。

## Carice TC2:复古电动车的全新演绎 Carice TC2 是一款引人注目的纯电动汽车,在荷兰设计和制造。它将21世纪的技术与经典汽车美学相结合。这款轻量化车辆(起步重量590公斤)提供充满活力和优雅的驾驶体验,优先考虑放松和享受。 TC2 拥有高达300公里的续航里程(配备更大电池组)和快速充电功能。它采用后轮驱动,双叉骨前悬架和带有能量回收制动功能的碟刹。定制化是关键,提供车漆、内饰和车顶颜色的选择。 目前,正在接受下一批生产订单,名额有限。价格从44,500欧元起(不含税)。Carice TC2 符合欧洲法规,可以在欧盟及其他多个国家/地区驾驶。 感兴趣的买家可以在Carice网站上预订试驾、配置车辆并查找详细规格。注册时事通讯以获取新闻和可用性的最新信息。

## Carice TC2:一款复古风电动汽车 Carice TC2 是一款全新的纯电动汽车,旨在提供更简单、更少互联的驾驶体验。起售价为 44,500 欧元(不含税),它采用经典设计,注重模拟控制和极简主义座舱——摒弃了现代电动汽车中常见的巨型屏幕。 配备 31.5kWh 电池,续航里程为 300 公里,重量为 630 公斤。虽然它缺乏直流快速充电功能,但讨论强调了这款汽车优先考虑驾驶感受和隐私,而非广泛的数字功能。 评论员指出它与经典汽车(如保时捷 356 和大发 Copen)相似,并争论其价格定位是奢侈品还是爱好者可行的替代选择。对话还涉及对价格实惠、尊重隐私的电动汽车的更广泛需求,并提到了 Slate 汽车等替代品。

## QUIC 与 NAT 穿越的未来 多年来,通过网络地址转换器 (NAT) 和防火墙建立直接连接(使用 STUN、ICE 和 TURN 等协议)一直很复杂。本文探讨了现代传输协议 QUIC 如何为点对点 (p2p) 网络提供一个简化的解决方案。 传统上,p2p 连接依赖于通过 STUN 发现公网 IP 地址,协调“打孔”以打开防火墙路径(ICE),并在无法建立直接连接时回退到中继服务器(TURN)。QUIC 通过**连接迁移**简化了这一点,允许连接切换到新的 IP 地址——这对于更改网络的移动设备非常有用。 QUIC 通过探测新路径来实现类似“打孔”的效果,并且可以利用新的 **QUIC 地址发现**机制来取代 STUN,安全地交换地址信息。此外,QUIC 可以利用 **基于 HTTP 的 UDP 代理**(通过 RFC 9298 和相关草案)进行可靠的中继,在无法建立直接连接时使用,甚至允许节点通过代理 *监听*。 虽然仍在不断发展,但这种基于 QUIC 的方法有望为 NAT 穿越提供更强大、更高效的解决方案,从而可能简化 p2p 网络开发并改善连接性。 持续的工作包括为实现更高的弹性和性能而调整系统以适应多路径连接。

## P2P over QUIC:Hacker News 讨论总结 这次 Hacker News 的讨论围绕着使用 QUIC 协议构建点对点 (P2P) 连接的可行性。QUIC 基于 UDP,由于更容易穿透 NAT,非常适合 P2P,但仍然存在挑战。 一个关键问题是 NAT 穿透——某些 NAT 配置(对称 NAT、CG-NAT)本质上会阻止 P2P 连接。虽然存在 TURN 服务器等解决方案,但它们引入了中继,从而否定了直接 P2P 的优势。参与者们争论穿透 NAT 是否真的会被“禁止”,一些人指出 SOCKS 代理或 CG-NAT 等网络限制实际上会阻止它。 提到了几个项目,包括 `qotp` 和 `qh`,它们探索了在 QUIC 之上进行加密,以及 Yggdrasil,一个利用 QUIC 和自签名证书的 P2P 网络。讨论还涉及了 WebTransport,一个相关的协议,以及浏览器中 P2P 支持的可能性。 最终,共识是虽然 P2P over QUIC 是可行的,但它并非普遍可靠,并且通常需要解决方法或接受一定比例的连接失败。

辉光计算机是一个全新的开源计算项目,从头开始构建,旨在从大科技的影响中夺回个人计算权,以及它们对数据提取的关注。他们认为当前系统优先考虑参与和监控,而非用户自由和创造力。 辉光提供了一种全新的设计——硬件和软件兼具——优先考虑用户能动性、专注力和创造的乐趣。值得注意的是,它*不*包含网页浏览器,而是提供一个受精选的网络,灵感来自早期的互联网,且无追踪器。 辉光旨在让所有人都能访问,强调编码作为核心技能,力求简化软件创建,并利用人工智能的进步进一步赋能用户。它是一个“离线优先”的系统,为隐私和控制而构建,设想一个个人电脑真正属于其用户的未来,并培养好奇心和实验精神。

## RadiantOS:一种新的操作系统概念 RadiantOS 旨在成为一个“AI原生”操作系统,从底层构建,将计算机视为用户思维的延伸。它设想一个数据像个人维基一样互联互通的系统,摆脱传统的文件夹结构。其关键组成部分是内置的、本地运行的AI,旨在理解应用程序并创造性地协助用户。 该项目雄心勃勃,涵盖新的操作系统、编程语言(Radiance,灵感来自Rust、Swift和Zig)以及定制硬件。虽然编译器(R')的初步工作已经完成,但人们对该项目的实际进展以及对其展示内容可能依赖于AI生成的内容表示担忧。 讨论的中心在于,这是否代表着一种真正全新的计算方式,还是另一个未能实现的愿景。一些人看到了从头设计的潜力,而另一些人则质疑其目标的实用性和新语言的必要性。该项目引发了关于抽象、可访问性以及AI在未来计算中作用的辩论。

## Chrome 将弃用 XSLT:摘要 Google Chrome 计划在 **2026 年 11 月 17 日** 停止对 XSLT(可扩展样式表语言转换)的支持,其他浏览器如 Firefox 和 WebKit 也会效仿。XSLT 是一种用于转换 XML 数据(通常转换为 HTML 以进行显示)的语言。此移除是出于 **安全考虑**;处理 XSLT 的老旧代码库容易受到攻击。 **关键日期:** Chrome 143(2025 年 12 月 2 日)开始显示弃用警告,Chrome 155(2026 年 11 月 17 日)完全移除。源试用和企业策略将提供临时扩展。 **受影响的内容:** XSLTProcessor JavaScript API 和 XML 样式表处理指令都将被移除。 **迁移选项:** 使用 XSLT 的开发者应考虑: * **服务器端处理:** 将 XSLT 转换移动到服务器端并交付 HTML。 * **JSON:** 迁移到 JSON 数据格式并使用 JavaScript 进行渲染。 * **JavaScript 库:** 使用客户端 XSLT 库,如 Saxonica。 * **Polyfill:** 实现 polyfill 以维护现有功能。 * **浏览器扩展:** 使用浏览器扩展以继续获得支持。 虽然 XSLT 很少使用(影响小于 0.02% 的页面加载),但安全风险超过了其效用。Chrome 还在通过过渡到基于 Rust 的解析器来提高 XML 解析的安全性。

作者在体验了2025年重制版后,重温了1989年为Apple //e发行的文本冒险游戏《蓝王子》。尽管重制版拥有改进的画面,但作者更喜欢原版。 1989年的《蓝王子》以其巧妙的谜题而著称——特别是需要实际翻转软盘来倒置房间的谜题——以及高效的游戏玩法。房间的描述直接明了,最大限度地减少了繁琐的搜索,并且响应迅速的键盘允许快速探索。 重制版虽然在视觉上更具吸引力,拥有3D环境,但感觉节奏不必要地缓慢。作者认为,原版简约的ASCII艺术和横向思维谜题创造了更引人入胜的体验。他们建议对重制版感到失望的人尝试经典版本,可以通过Apple模拟器轻松访问。最终,原版《蓝王子》因其独创性和快节奏而脱颖而出。

## 蓝色王子与复古游戏讨论 一篇 Hacker News 帖子引发了关于在老式系统(特别是软盘交互)上重现游戏《蓝色王子》的谜题机制的可能性讨论。最初的帖子戏谑地暗示存在一个 1989 年的版本,促使用户探索那个时代的的技术挑战和创意解决方案。 对话深入探讨了软盘是否可以倒置插入,以及电脑如何检测到这一点。用户分享了关于 Apple II 和 BBC Micro 上 5.25 英寸软盘的轶事,强调了双面软盘和巧妙编程(如《空手道卡》)如何实现隐藏内容,甚至倒置的游戏版本。 讨论范围扩大到考虑图形游戏独特的优势,例如视觉中的隐藏细节,可能难以在基于文本的冒险游戏中复制。最终,许多人认为该帖子是一个富有创意的思想实验,可能被设计成供 LLM 摄取,并赞赏作者在构建一个可信的(尽管是虚构的)场景方面的技巧。

## 超越黑与白:用FuzzyGraph可视化方程 传统的数学绘图以二元方式显示解——一个点只有在方程等于零时才存在。然而,这种“黑白”视图隐藏了关键信息。FuzzyGraph引入了一种“非二元”方法,不仅可视化精确解,还可视化方程*几乎*等于零的区域,揭示了先前不可见的“数学阴影”。 这些阴影表现为独特的特征。例如,在方程 (y/x² + y² = (x+1)/x² + y²) 中会出现“黑洞”,在 y = x/(x² + y²) 中会出现眼状结构,这些在传统图形中完全不存在。FuzzyGraph还将近解突出显示为“水下岛屿”——通过轻微的方程调整揭示的微妙细节。 此外,反转方程的一部分(使用除法代替乘法)会产生“阴影线”或“阴影圆”,它们比标准绘图提供更细致的可视化效果。本质上,FuzzyGraph揭示了更丰富的数学地形,允许更深入地理解方程行为,而不仅仅是简单的解点。这种新方法可以揭示隐藏的模式,并建议修改方程以使近解显现出来。

## 黑客新闻讨论:“模糊绘图”与方程可视化 一场黑客新闻讨论围绕着一个新网站 ([gods.art](https://gods.art)),该网站展示了一种新的方程绘图方法——基于方程左右两侧的*差异*进行可视化,而非严格相等。作者将此呈现为一种新型绘图方式,引发了争论。 许多评论者指出,这种技术并非新颖,并将其与计算机图形学和偏微分方程可视化等领域中已建立的概念联系起来,例如水平集、符号距离函数和热图。他们认为该网站对自身新颖性的声称被夸大了。然而,许多人也承认这种可视化在美学上令人愉悦,并且可能以不同的方式帮助理解方程,特别是对于那些不熟悉这些现有技术的人。 核心思想——表示方程两侧“有多大不同”——引起了一些人的共鸣,他们建议将其应用于优化和误差分析等领域。作者承认了反馈,并承认其最初的说法可能存在夸大,并分享了一个Python库 ([truthygraph.py](https://github.com/calebmadrigal/truthygraph.py)),供那些有兴趣探索类似可视化的人使用。这场讨论强调了展示想法并从知识渊博的社区获得反馈的价值。

更多

联系我们 contact @ memedata.com