每日HackerNews RSS

启用 JavaScript 和 Cookie 以继续。

## 重新思考SARS-CoV-2与免疫 一篇《英国医学杂志》(BMJ)的文章正在Hacker News上引发关于SARS-CoV-2长期免疫效应的争论。讨论的中心是已被证伪的“免疫债务”假说——即封锁期间减少了疾病暴露导致免疫系统减弱,随后更容易感染疾病。 许多评论员认为“免疫债务”不科学,指出其源于有缺陷的研究,并且被方便地用作结束新冠预防措施的理由。他们强调,病毒实际上可能*耗尽*免疫防御,类似于麻疹,而不仅仅是需要“锻炼”。 对话涉及免疫记忆的复杂性、通过暴露(如疫苗)建立免疫力与持续“挑战”之间的区别,以及长期免疫破坏的可能性。一些人认为最初的假设本身并非不科学,而是被政治化利用,而另一些人则强调严格的科学证据比“常识”解释更重要。该帖子还强调了对错误信息以及有偏叙述影响公共卫生讨论的担忧。

Curl 8.16.0 版本尝试使用 `pthread_cancel()` 提升性能,结果适得其反,现在该功能正在被移除(#18540)。目标是使用单独的线程进行 `getaddrinfo()`(DNS 解析),以防止在长时间的名称查找过程中阻塞主 curl 进程。 然而,使用 `pthread_cancel()` 取消线程导致了内存泄漏。问题在于 `glibc` 处理 `getaddrinfo()` 的方式及其与 `/etc/gai.conf` 文件的交互。在 `getaddrinfo()` 内部读取文件时进行取消会导致分配的内存成为孤儿,并且这种情况可能会反复发生。 开发者认为,在 `glibc` 的设计中可靠地防止这些泄漏过于复杂且对于一个如此常用的库来说是不可接受的。他们选择恢复到可能在 `getaddrinfo()` 上阻塞,而不是冒着内存泄漏的风险。需要非阻塞 DNS 解析的用户建议使用 `c-ares`,但它可能无法提供 `glibc` 的全部功能。

## Hacker News 讨论:pthread_cancel 终结与 DNS 解析 一场 Hacker News 讨论围绕着一篇关于 libcurl 中 `pthread_cancel` 问题的最新博文,具体与阻塞 DNS 解析相关。核心问题:取消执行 `getaddrinfo` 的线程可能导致内存泄漏,因为缺少清理程序。 用户强调可靠线程取消的困难,提倡使用非阻塞 API。 许多人指出跨平台缺乏标准化的、可取消的异步 DNS 解析。 讨论的解决方案包括使用像 c-ares 这样的库,利用特定平台的异步 API(Windows、BSD、Android),或采用线程池。 一个反复出现的主题是 POSIX 标准的历史遗留问题和复杂性,特别是关于超时和异步操作。 许多人认为 DNS 解析应该作为系统服务处理,而不是在 libc 中处理,以便更好地缓存和管理。 讨论还涉及线程创建开销与潜在资源泄漏之间的权衡,以及在使用线程解决方案时 fork() 兼容性的挑战。

雄心勃勃的“安全C++”提案,旨在为C++带来类似Rust的内存和线程安全保证,已被放弃。该提案试图通过选择加入的“安全上下文”来创建C++的安全子集,允许现有代码保持“不安全”状态,同时为新的或重构的代码启用更安全的开发。然而,C++委员会优先考虑了一种不同的方法:“Profiles”(配置)。 Profiles定义了受约束的C++模式,通过*限制*现有语言特性来保证安全属性,而不是引入新的特性。这提供了向后兼容性——代码无需采用Profiles即可继续运行。虽然Profiles的范围不如安全C++全面,但被认为更实用且易于采用,解决了常见的C++陷阱,而无需强制执行完整的Rust安全模型。 社区对采用Rust模型的抵制以及委员会对不那么激进的方法的偏好促成了这一决定。尽管Profiles可能提供较弱的保证和不均匀的执行,但它们代表了通往更安全的默认C++标准的一个更现实的途径。

## C++ 安全努力停滞,Rust 仍然是强有力的替代方案 “安全 C++”提案已被取消,凸显了在语言中添加强大安全功能所面临的持续挑战。虽然 C++ 委员会继续致力于“Profiles”(一种旨在逐步提高安全性的系统),但许多人认为这种方法不足以实现真正的内存安全,并且缺乏像 Rust 这样的解决方案的可组合性。 一个关键问题是 C++ 社区对安全的重视程度不足,这与 Rust 强大的安全文化形成了鲜明对比。最近的 CppCon 炉边谈话中,人们对委员会的优先事项和进展缓慢表示担忧。一些人认为 Profiles 专注于为了监管目的*看起来*安全,而不是实现真正的安全。 讨论还涉及替代方法,例如 scpptool 项目,该项目旨在通过静态分析实现安全,以及构建在 C++ 优势之上的更像 Rust 的语言的可能性。最终,对话强调了将安全逆向移植到像 C++ 这样复杂的语言中的困难,这使得许多人认为 Rust 是优先考虑内存安全的项目的更可行的选择。这场辩论也凸显了系统编程语言中性能、表达力和安全之间的紧张关系。

## 理解 Ruby 的 JIT 编译器 (YJIT & ZJIT) Ruby 的 JIT(即时编译)编译器,例如 YJIT 和更新的 ZJIT,通过将字节码转换为本机机器码来显著提高性能。然而,这个过程比简单的替换更复杂。Ruby 在每个方法的 ISEQ(指令序列)数据结构中保留字节码 *和* 编译后的代码。`jit_entry` 字段指向可用的编译代码;否则,Ruby 将解释字节码。 编译并非自动进行。方法会被分析 – 最初被解释,然后被监控 – 并且只有在达到特定调用阈值后(ZJIT 中目前是 25 用于分析,30 用于编译)才会进行编译。这段“预热”时间对于达到最佳性能至关重要。 然而,JIT 编译的代码并非万无一失。它依赖于对代码行为的假设(例如,数据类型)。如果这些假设被违反(例如,当它期望整数时,调用一个将浮点数作为参数的加法方法),代码会“反优化”,恢复到解释执行以确保正确的结果。激活 `TracePoint` 调试或更改核心方法等事件也会触发反优化。 这种动态方法在速度、安全性和效率之间取得了平衡,避免对很少使用的代码进行不必要的编译,并保证即使假设发生变化也能正确执行。 要深入了解,请参阅“ZJIT 已合并到 Ruby 中”和 Kevin Newton 的“Advent of YARV”系列。

## Ruby JIT 编译讨论于 Hacker News Hacker News 上进行了一场关于通过即时编译 (JIT) 提高 Ruby 性能可能性的讨论。Ruby 的动态特性给 JIT 编译器带来了挑战——由于运行时代码修改,需要不断验证假设——但一些评论员指出,.NET 和 JavaScript 引擎等其他虚拟机中已有的解决方案,使用后台编译(“分层编译”)。 核心争论在于 Ruby 是否能达到 JVM 的速度。许多人认为这不太可能,因为 Ruby 的设计优先考虑灵活性而非静态优化。然而,TruffleRuby 和 JRuby(在 JVM 上运行的 Ruby 实现)表明 Ruby *可以* 利用 JVM 的性能,尽管存在权衡。 其他提出的想法包括 Ruby 中的一个受限制的“子语言”,禁用动态特性以方便编译,或者一种机制,向 JIT 编译器发出信号,告知代码部分具有有限的动态性。讨论还涉及 VM 快照以加快启动时间,并承认 Ruby VM 开发与 JVM 之间的巨大投资差距。

经过四年的谜团,米歇尔·威利终于找到了2021年她婚礼上那个尴尬的陌生人。照片中那位身穿深色西装、表情窘迫的高个子男人,被确认为安德鲁·希尔豪斯,他错误地参加了错误的婚礼。 希尔豪斯急着赶往艾尔的婚礼,错误地跟着宾客走进了普雷斯威克卡尔顿酒店,误以为那就是正确的地点。直到另一位新娘走上红毯,他才意识到自己的错误,但还是觉得有必要留下,试图在仪式上融入其中。他甚至被婚礼摄影师拉去合影了! 一次脸书上的求助,经苏格兰内容创作者达扎的传播,促成了希尔豪斯的羞愧承认。他最终赶到了正确的婚礼,并成为了当晚的明星讲故事者。威利最初担心那个人可能是个跟踪狂,现在已经和希尔豪斯成了脸书好友,并很高兴解开了这个长久以来的谜题。

## 黑客新闻讨论总结:婚礼冒领者及相关话题 一个黑客新闻的帖子源于一个男人意外参加了一个婚礼,直到仪式开始后才意识到自己的错误。他为了不打扰活动而留了下来,甚至和这对夫妇合影了。这引发了一系列用户分享类似经历的轶事——参加了错误的活动、混淆了约会时间,或者发现自己身处尴尬的社交场合。 讨论很快蔓延到各种离题,包括关于西班牙语言和身份认同的争论(特别是加泰罗尼亚语与卡斯蒂利亚语),与类似事件的比较(比如一个人在被“解雇”后在苹果公司工作),甚至更广泛地讨论公司文化、员工权利和国家认同。 许多用户分享了与这些主题相关的个人经历,突出了文化差异和工作场所的体验。 最终,这个帖子表明,一个简单、 relatable 的故事如何能在黑客新闻社区中引发各种相关想法和经历,并且常常会深入到复杂而细致的讨论中。

## 查理·柯克遇害事件引发失业与审查 极右翼活动家查理·柯克遇害引发广泛 repercussions,导致多人因在社交媒体上发表批评柯克的言论而失业或受到 censure。教师、消防员、记者、政府雇员(包括一名特勤局特工和五角大楼工作人员),甚至一名 NFL 员工,因表达不利观点而被解雇、停职或调查。 在特朗普政府承诺对那些“赞扬”凶杀案的人采取行动的推动下,并受到保守派人士积极寻找“ objectionable”帖子 的助长,一股右翼愤怒浪潮随之而来。一些共和党人甚至提倡将柯克的批评者驱逐出境或永久封禁其社交媒体账号。 此次打击与过去的行径形成鲜明对比;许多现在表达愤怒的人过去曾嘲笑政治暴力的受害者。这一情况凸显了言论自由以及在线表达后果之间日益增长的紧张关系,公司和机构优先考虑 perceived loyalty 而不是开放辩论。 几个人声称他们的评论在激烈的反弹中被误解或断章取义。

## AI 必然出现的幻觉 OpenAI 的研究表明,“幻觉”——像 ChatGPT 这样的大型语言模型自信地陈述错误信息——并非错误,而是这些模型运作方式的数学上的*必然*结果。即使使用完美的数据进行训练,逐字预测文本的概率性质本身就不可避免地导致错误累积,从而导致比简单任务更高的错误率。 当前 AI 评估基准进一步加剧了这个问题,这些基准会惩罚不确定性,有效地奖励自信的猜测,而不是承认“我不知道”。这为模型*始终*回答创造了强大的动机,即使回答不正确。 虽然存在解决方案——例如模型量化自身的置信度,以及基准奖励诚实的模糊性——但它们面临着重大障碍。评估不确定性的增加计算成本使其对于需要快速、廉价响应的消费者应用来说过于昂贵。目前,商业激励措施优先考虑自信的答案和速度,而不是准确性,这意味着幻觉可能会在广泛使用的 AI 系统中持续存在。然而,对于准确性胜过成本的关键应用(例如金融或医学),采用感知不确定性的 AI 在经济上是可行的,也是必要的。

## OpenAI 研究:幻觉不可避免(且受惩罚) 最近一篇 OpenAI 的研究论文,在 Hacker News 上讨论,强调了防止大型语言模型 (LLM) “产生幻觉”——自信地提供错误信息——的固有挑战。核心问题在于,当前的基准测试*惩罚*模型表达不确定性(“我不知道”),激励它们猜测而不是承认局限性。 用户希望得到明确的答案,而经过训练以优先执行操作而非承认不确定性的模型,在领先的排行榜上表现更好。讽刺的是,基础模型通常比经过后训练的模型更“校准”(在置信水平上更准确)。 评论者提出了诸如单独的“自信”和“诚实”模式、新的基准测试系统,以及训练模型明确识别其知识边界等解决方案。然而,一个关键点是,LLM 被设计用来*回答*问题,不一定是为了准确评估它们自身回答问题的能力。最终,讨论的中心是事实准确性和用户体验之间的权衡,以及优先考虑自信(即使可能不正确)的回答是否在经济上有利。

关于按住版权联系我们创作者广告开发者条款隐私政策和安全性YouTube的工作原理测试新功能© 2025 Google LLC

基于能量的Transformer [视频] (youtube.com) 43点 由 surprisetalk 1天前 | 隐藏 | 过去 | 收藏 | 3条评论 cs702 1天前 | 下一个 [–] 我建议阅读主要作者的博客文章,而不是观看这个视频:https://alexiglad.github.io/blog/2025/ebt/ 另外,请参阅:https://www.reddit.com/r/MachineLearning/comments/1lu1ia0/r_...回复 programjames 1天前 | 父级 | 下一个 [–] TLDR;训练一个“能量”模型来检查输出是否正确(而不是直接输出),并使用梯度下降来寻找好的输出。使用Transformer。回复 tripplyons 1天前 | 上一个 [–] 我之前看过该频道的一些视频,其中很多都包含错误。我还没有阅读《基于能量的Transformer》论文,所以不能确定这个视频是否包含任何错误,但请小心。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

现代复杂系统——从互联网到供应链——并非源于宏伟设计,而是源于简单、可用的原型,并随着时间的推移不断迭代改进。尽管偏好“系统思考”和精细分析,但试图*控制*这些系统的尝试往往以惨败告终,例如HealthCare.gov和澳大利亚残疾人福利改革的代价高昂的失败就证明了这一点。 核心问题不是缺乏分析工具,而是对复杂系统行为方式的误解。它们抵抗操纵,干预往往会适得其反——这一原理类似于化学中的勒夏特列原理。成功的系统构建并不在于修复现有的复杂性,而在于从一个*简单*且可用的系统开始,并允许其演化。 美国洲际弹道导弹计划和爱沙尼亚的数字政府等例子证明了这一点:绕过现有的官僚机构,创建重点明确、负责任的新系统,取得了积极成果。即使像人工智能生成代码这样的进步也无法克服这一基本原则。随着系统变得越来越复杂,并可能超出人类控制范围,优先考虑简单、实用的开端,提供了最可行的前进道路——回归所有成功系统的起源。

## Hacker News 讨论“神奇的系统思维”总结 Hacker News 的讨论围绕一篇批评“系统思维”的文章展开,该文章认为它常常被误用且无效,尤其是在大型项目中。文章的核心观点——构建或修复复杂系统很困难——引发了争论。 许多评论者不同意文章对该领域的广泛否定,认为它歪曲了系统思维。他们指出,真正的系统思维*承认*模型的局限性,预见对变革的抵制,并专注于理解现有系统,而不是强加自上而下的解决方案。 许多人强调认识意外后果和反馈循环的重要性。 一个主要的争论点是作者是否攻击了一个稻草人——对系统思维的错误描述——这源于对官僚主义的负面经历。 另一些人认为,作者的批评源于对从头开始构建的偏好,这与该出版物的理念一致。 讨论还涉及了诸如控制论、复杂性理论以及实践应用与理论建模的重要性等相关领域。最终,共识倾向于系统思维是一种有价值但细微的方法,但常常受到误解和不切实际的期望的阻碍。

未来已来:LinHT 首次成功启动。我们相信软件定义收发机将是业余无线电的下一个大趋势。LinHT 是当今业余无线电领域最重要的硬件项目。Bruce Perens, K6BP https://perens.com/2025/08/12/whats-wrong-with-ardc/ 该测试设备没有射频放大器(尽管我们将在下一次修订版中包含 GRF5604 射频放大器,见此)。此测试设置的输出功率约为 5dBm。频率范围:420-450MHz (UHF)。尽管有些人怀疑这种设计是否可行,但我们坚持不懈地继续工作。特别感谢 Vlastimil OK5VAS 和 Andreas OE3ANC。没有你们的帮助,这个项目不可能实现。LinHT 快速初步预览。该设备是开源硬件。PCB 设计在这里提供。原型制作总成本:– PCBWay 的 PCB+组装费用为 490 美元(5 件)– Retevis C62 (供体)– SoM 费用为 469 美元,5 件。

一个新的开源软件定义无线电(SDR)业余无线电收发器原型正在业余无线电社区中引起关注(m17project.org)。Hacker News上的用户正在讨论它的潜力,特别是与FreeDV音频编解码器结合使用时,这可以显著提高数字通信的范围和清晰度。 讨论要点包括项目的模数/数模转换器、潜在的更宽带宽录制能力(例如整个2米频段)以及对现有SDR应用程序(如rtl_tcp_echo)的可能软件贡献。 成本是一个关键问题,预估零件费用在60美元左右,优化生产后零售价可能在100美元或更低。有人建议自行组装可以进一步降低成本,而另一些人指出进口关税会迅速推高已组装板的价格。500美元的初始投入被视为个人爱好者的障碍,但该项目让人想起业余无线电和计算中较早、更易于获得的套件构建机会。

更多

联系我们 contact @ memedata.com