每日HackerNews RSS

## 世界模型与预测的力量 下一帧和下一词元预测是强大的预训练任务,因为它们迫使模型直接从数据中学习世界运作方式,所需的先验知识最少。减少对接下来发生的事情的不确定性,能够解锁越来越强大的能力——在语言模型中,随着上下文长度的增加,这一点表现得尤为明显。 这个原理延伸到从视频中学习的“世界模型”。为了预测未来的观察结果,模型必须推断世界的潜在状态以及它的变化方式,从而掌握物理学、因果关系和持久性。至关重要的是,需要*长*序列来学习维持内部“隐藏状态”——即使在未观察到的情况下也能理解事件(例如,正在注满的浴缸)。 与建立在手工规则上的传统模拟器不同,后者仅限于特定领域,世界模型*学习*从海量视频数据中进行模拟。这允许采用一种更通用、更可扩展的方法,模型可以动态地关注关键信息,而不是受预定义保真度的约束。这代表着向学习模拟本身转变,有望在表示复杂、长时效动力学方面取得重大进展。

一个名为“odyssey.ml”的新项目正在引起关注,被宣传为“世界模拟器”,但Hacker News社区的早期反应持怀疑态度。用户质疑它是否符合炒作,认为它更像是一种高级视频生成,而非真正的模拟。 一些评论员指出,演示视频并没有像名称暗示的那样展示科学实验。相反,它似乎是一个实时交互式视频生成器,可能是一种更复杂的递归视频形式,但本质上并没有不同。 一位用户恰当地称“世界模拟器”的标签为“营销噱头”,并指出当前版本并不特别令人印象深刻,但未来的迭代可能值得关注。讨论的中心在于该项目是否超越了现有的视频生成技术。

在1996年《Quake》开发的期间,团队面临着由于早期互联网速度和新兴3D技术的限制而带来的重大技术挑战。关卡设计受到严格的1.4MB地图数据(BSP文件)文件大小限制的严重制约,以便于下载。性能也至关重要;当世界多边形数量超过350时,闪烁的红色屏幕会警告开发者,需要通过可见性阻挡进行仔细优化。 内部关卡编辑器QuakeEd,按今天的标准来说非常简陋。它从头开始构建,缺乏流畅的3D导航,并且依赖于简单的“笔刷”几何体——用于构建整个关卡的3D矩形。设计师使用有限的视角工作:俯视、侧视和一个小的渲染3D预览,使用独特的X坐标系统进行垂直放置来操作笔刷。尽管存在这些挑战,QuakeEd仍然能够在这些严格的限制下创建《Quake》的突破性关卡。

## Quake 玩家速度与技术讨论 最近 Hacker News 上出现了一场关于 John Romero 在 Quake 开发笔记中的讨论,具体是关于刻意保持逼真的玩家速度——与《Doom》等游戏中常见的超人速度形成对比。用户们争论诸如火箭跳跃和兔子跳等高级移动技巧是关于“加速”游戏,还是在平衡的系统内利用现有机制。 对话还深入探讨了 Quake 渲染的技术方面,重点是多边形限制和“潜在可见集”(PVS)——一种通过预先计算可见多边形来优化性能的方法。用户们讨论了自动化这个过程以及准确性和性能之间的权衡。 除了 Quake 之外,该话题还扩展到更广泛的 FPS 游戏中耐力机制的讨论,引用了《逃离塔科夫》和《暗黑破坏神》等例子,以及有效实施它们的挑战。最后,一个离题讨论探索了 YouTube 上过长且节奏缓慢的视频趋势及其盈利策略。

## Microdot 中的 CSRF 保护现代化 最近,作者为他们的 Web 框架 Microdot 添加了 CSRF(跨站请求伪造)保护。 最初计划实现传统的反 CSRF 令牌方法,但他们发现一种更新、更简单的方法在 Go 和 Ruby 社区中越来越受欢迎。 这种“现代”方法利用了现代浏览器自动包含的 `Sec-Fetch-Site` HTTP 标头。 该标头可靠地指示请求是否来自同一站点,从而防止恶意跨站点请求。 作者实施了此方法,并添加了选项来控制子域处理以及使用 `Origin` 标头作为后备机制,以支持缺乏 `Sec-Fetch-Site` 支持的旧版浏览器。 有趣的是,这种方法尚未获得 OWASP(开放 Web 应用程序安全项目)的完全认可,目前列为“纵深防御”而不是完整解决方案——尽管社区讨论呼吁将其提升。 尽管如此,作者认为这对 Microdot 来说是一项重大改进,符合其简约设计。 该实现是开源的,可供审查,并会持续监控 OWASP 的指导,以便进行潜在的未来更新,包括在需要时基于令牌的后备方案。

这个Hacker News讨论围绕CSRF(跨站请求伪造)保护方法。最初的帖子强调了一种避免传统CSRF令牌或隐藏表单字段的技术,而是依赖于像`Sec-Fetch-Site`这样的HTTP头部。但作者澄清了一个错误:OWASP最近更新了其指导,将Fetch Metadata定位为顶级的CSRF保护,此前曾短暂将其降级为“纵深防御”。 对话随后分化到替代和补充方法。几位评论者提倡`SameSite` cookie属性(“Strict”或“Lax”)作为一种更现代、更简单的解决方案,尽管OWASP目前将其视为二级防御。有人担心`SameSite=Strict`可能会在使用外部链接导航时将用户注销。 讨论还涉及基于头部保护对复杂XSS攻击的局限性,并强调CSRF主要解决*没有*访问身份验证令牌的攻击,利用浏览器cookie处理。最终,该帖子强调了网络安全不断变化的环境以及关于最佳CSRF缓解策略的持续争论。

## 新的IPv4“沼泽”:摘要 IPv4地址空间,曾经面临耗尽,现在类似于20世纪90年代历史上的“沼泽”——特点是地址管理分散、效率低下。虽然最后一个IPv4区块是在2011年分配的,但它们的分配方式反映了旧的沼泽:大量小型前缀(通常为/24)分配给众多实体。 最初,RIPE NCC和LACNIC等注册机构迅速分配了新的区块,随后是APNIC和ARIN。今天,几乎所有这些地址都已分配,但与过去不同,这并没有解决路由问题。互联网路由表中的路由数量激增(现在超过100万),/24前缀仍然占60%以上——阻碍了地址聚合。 这种碎片化影响了互联网安全。地址波动性增加——区块频繁易手——使得将活动与声誉关联变得困难,导致威胁缓解方面可能出现不准确的情况。有效的安全现在需要实时可见性、主动自动化缓解以及情报驱动的防御,以应对这个日益不稳定的环境中不断演变的网络威胁。本质上,整个IPv4空间已经采用了原始“沼泽”的特征,为网络安全和管理带来了新的挑战。

## IPv4地址“沼泽”与IPv6争论 一篇近期文章(由NETSCOUT推广)强调了持续存在的IPv4地址短缺问题,以及由此产生的碎片化地址分配“沼泽”。这导致路由前缀激增,给路由器容量带来压力并增加复杂性。 讨论的中心在于IPv6是否是解决方案。虽然IPv6提供了一个巨大的地址空间,但一些评论员表达了担忧。有人认为IPv6的丰富性可能导致随意分配和再次耗尽,以及网络犯罪增加。另一些人质疑IPv6是否真正简化了路由,担心地址数量的爆炸式增长,尽管前缀数量可能减少。 核心问题在于IPv4的短缺迫使网络使用许多小而不连续的地址块,每个地址块都需要一个路由表条目。IPv6的大型空间允许使用更大的聚合块,从而可能*减少*路由表的大小。路由器硬件的技术进步(如7200 VXR)也使得处理越来越多的路由成为可能。最终,争论的焦点在于IPv6的地址空间优势是否超过实施和安全方面的潜在缺点。

Wisp 是一种新语言,利用了 **同像性** 的力量——将代码视为数据,反之亦然的能力,这是基于 Lisp 的语言的关键优势。这使得优雅的代码操作和更简单的语言扩展成为可能,因为代码可以轻松地在不同的程序层之间传递。 开发者通过多次迭代改进 Wisp 代码来利用这一点:首先是初稿,然后是增量改进,最后是准备好用于规范的代码。这种方法在创建复杂功能时尤其有价值,例如为游戏 *dryads wake* 创建一个“提问”宏。 该宏使用同像性将选项表示为数据(问题),同时允许答案直接执行代码(例如,`,(load-game)`)。 `Ask` 宏和 `QuoteFirsts` 函数促进了这一点,从而实现了交互式游戏元素的动态且易于管理实现。

一个黑客新闻的讨论围绕着一个声称 GNU Guile “比其他语言好 10 倍” 的说法。评论者承认 Guile 具有有趣的特性和稳定的生态系统,但大多不同意这个说法的程度。 一个主要的批评集中在 Guile 的文档上,被描述为组织混乱,假定先验知识(RnRS/SFRIs),并遭受“专家诅咒”——对新手不清楚。一位用户建议举办黑客马拉松来改进基本的文档元素,例如定义缩略语。 其他人指出,与 Python 和 JavaScript 等现代替代方案相比,Guile 的优势不那么明显,其生产力优势更多地来自于生态系统的稳定性,而不是革命性的特性。提及 Crystal、Elixir 和 Gleam 等其他语言突出了替代偏好以及找到“正确”工具的挑战。 还有一个注释提到一个有用但未维护的库 `guile-pfds`。

这篇帖子详细介绍了一项关于童谣“Jingle Bells, Batman Smells”的有趣非正式研究。作者是一位具有科学背景的词典编纂者,他在BlueSky上发起了一项关于人们记忆中童谣版本的调查,收到了意想不到的大量回复。 分析显示出鲜明的“跨大西洋差异”:英国的版本非常多样化,包含圣诞老人等角色和本地化参考(特定高速公路),而北美版本则 overwhelmingly 集中在“罗宾生了个蛋”和蝙蝠车掉轮子。北美的这种一致性与1989年《辛普森一家》中的一个情节有关,可能影响了集体记忆。 这项研究强调了民间传说如何演变,变体就像“进化树”中的突变。一些稀有的“活化石”版本也浮出水面,例如用孩子和屁替换蝙蝠侠的版本。最终,该项目表明,一个简单的童谣反映了文化差异以及媒体塑造——或者说*重塑*——我们记忆的力量。

## 叮当响,蝙蝠侠臭了:一首节日韵律的演变 一则 Hacker News 的讨论围绕着“叮当响,蝙蝠侠臭了”这句韵律出人意料的多样性和演变过程。原始文章(以及一段相关的 Tom Scott 视频)探讨了这首儿歌如何随着地区和世代的变化而变异,与传统的“叮当响”相去甚远。 评论者分享了许多变体——有些可以追溯到 1970 年代和 80 年代,早于通常被认为使其流行的《辛普森一家》。版本内容从小丑的失误和蝙蝠侠的受伤,到涉及圣诞老人去世或奶奶持枪的黑色幽默,不一而足。 国际变体也浮出水面,例如新西兰的一个例子提到了神奇女侠,而英国版本则涉及芸豆。 讨论强调了这句韵律通过口头传统——操场吟唱和共同经历——的传播,以及它适应当地幽默和文化参考的倾向。 除了蝙蝠侠之外,还注意到对经典歌曲(如《红鼻子驯鹿鲁道夫》和《闪烁闪烁小星星》)类似的戏谑性改编,这表明了一种更广泛的民间韵律演变现象。

今天,Groq宣布与英伟达达成一项非独家许可协议,涉及Groq的推理技术。该协议反映了双方致力于扩大高性能、低成本推理的可及性。作为协议的一部分,Groq创始人乔纳森·罗斯、总裁桑尼·马德拉以及Groq团队的其他成员将加入英伟达,以帮助推进和扩展这项许可技术。Groq将继续作为一家独立公司运营,西蒙·爱德华兹将担任首席执行官。GroqCloud将继续运营,不会中断。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Groq 和 Nvidia 的许可协议 (groq.com) 15 分,由 hasheddan 发表于 6 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 ChrisArchitect 6 小时前 [–] [重复] 讨论:https://news.ycombinator.com/item?id=46379183 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 2025年构建强大的100TB NAS:摘要 构建100TB网络附加存储(NAS)现在比以往任何时候都更经济实惠,并且更容易实现,为云存储和昂贵的预建解决方案提供了一种具有成本效益的替代方案。典型的构建成本约为2500-3500美元,使用TrueNAS SCALE(基于Linux的操作系统),配备八个18-22TB CMR企业级硬盘(Seagate Exos、WD Ultrastar或Toshiba MG系列)。关键组件包括支持ECC RAM的Supermicro X12STH-F主板(32-64GB)、Intel Xeon或AMD Ryzen CPU,以及刷新为IT模式的Broadcom LSI 9300-8i HBA,再加上10GbE网络连接。 与云服务(如Backblaze B2,100TB成本超过6000美元)或商业NAS盒子相比,这种DIY方法在五年内可以节省大量资金。它提供了对硬件、安全性和可扩展性的更大控制——对于4K视频编辑、大型数据集和虚拟化等苛刻任务至关重要。 优先选择CMR硬盘而非SMR,规划RAIDZ2以提高可靠性,并考虑未来的扩展。投资高质量的电源和UPS至关重要。TrueNAS SCALE的新OpenZFS 2.3功能,如RAIDZ扩展,进一步增强了灵活性。最终,DIY NAS以较低的成本提供企业级存储。

一篇最近的 Hacker News 帖子链接了一个“TrueNAS 存储指南”,旨在帮助用户构建 100TB 的 NAS,但评论员普遍批评这篇文章质量低劣,很可能由 AI 生成。 用户指出其中存在许多错误,包括不准确的价格(依赖于二手硬盘成本)、有缺陷的 RAID 计算,以及不现实的组件描述(例如,PCI-e 卡的两面都有触点)。虽然文章估计构建成本为 2,500 美元,但评论员认为,在当前硬盘价格下,可以实现显著更低的价格——低于 2,000 美元,而更强大的配置则低于 6,000 美元。 许多用户建议向 r/datahoarders 等社区寻求建议,一些人分享了他们自己成功且更实惠的 TrueNAS 构建案例,例如 Jonsbo N5 和使用工厂认证的硬盘。另一些人则选择了 QNAP 等替代 NAS 解决方案。

Steam目前遇到问题,状态检查网站(如SteamDB)的流量激增(过去一小时内16万次浏览量)表明了这一点。虽然并非完全中断,但Steam商店和Web API等多个核心服务运行缓慢。 目前Steam上有超过760万玩家在线,游戏活动依然活跃。连接管理器大部分在线(95.2%),但欧洲、南美洲和亚洲的多个匹配服务器报告负载过高或无法使用。具体而言,迪拜的可用性显示为0.0%,负载过高,约翰内斯堡也面临高负载。 SteamDB的后端系统(Bot、数据库)似乎运行正常。问题似乎集中在服务器容量和连接性上,影响用户体验,而非完全系统故障。

## Steam商店故障 - 圣诞节前夕 Steam商店于12月24日报告离线,导致用户登录问题和超时。故障发生在高峰时段,引发猜测可能是由于假日送礼和多人游戏传统导致的高流量。一些用户幽默地建议Valve可能正在准备发布《半条命3》的消息。 讨论集中在Steam服务器的压力上,评论指出在促销活动期间出现过类似问题。另一些人指出Steam的常规维护在星期二,故障很少发生,可能会延长调试时间。 关于使用“是否宕机”网站流量作为服务问题的指标的有效性,出现了一场争论——虽然不是决定性的,但高流量*与*广泛问题相关。用户还分享了一个技巧,即提前购买礼物并安排送达时间,以避免最后一刻的拥堵。

请求失败。Incapsula 事件 ID: 501000580131545945-336931976721534597

一份最近的卡托研究所报告,在Hacker News上讨论,声称国土安全部(DHS)正在违宪地将观察和抗议移民及海关执法局(ICE)特工的人员标记为“国内恐怖分子”。 这源于一项广泛的国土安全部政策,将“妨碍”和“公开身份信息”(即使只是记录或公开识别特工)定义为可能支持国内恐怖主义,从而引发调查以及对相关组织捐助者的潜在影响。 然而,法律先例通常保护记录执法人员、抗议和公开分享有关执法人员的信息的权利(在没有直接威胁的情况下)。 批评人士认为,国土安全部的这种做法是将国家安全机构武器化,用于对抗那些挑战政府行动的人,实际上是在惩罚异议。 一位评论员还指出了一条鲜为人知的宪法条款,允许总统暂停国会,凸显了行政权过度扩张的可能性。 这场讨论是在对政治动机的针对性担忧中产生的。

更多

联系我们 contact @ memedata.com