每日HackerNews RSS

雄心勃勃的“安全C++”提案,旨在为C++带来类似Rust的内存和线程安全保证,已被放弃。该提案试图通过选择加入的“安全上下文”来创建C++的安全子集,允许现有代码保持“不安全”状态,同时为新的或重构的代码启用更安全的开发。然而,C++委员会优先考虑了一种不同的方法:“Profiles”(配置)。 Profiles定义了受约束的C++模式,通过*限制*现有语言特性来保证安全属性,而不是引入新的特性。这提供了向后兼容性——代码无需采用Profiles即可继续运行。虽然Profiles的范围不如安全C++全面,但被认为更实用且易于采用,解决了常见的C++陷阱,而无需强制执行完整的Rust安全模型。 社区对采用Rust模型的抵制以及委员会对不那么激进的方法的偏好促成了这一决定。尽管Profiles可能提供较弱的保证和不均匀的执行,但它们代表了通往更安全的默认C++标准的一个更现实的途径。

## C++ 安全努力停滞,Rust 仍然是强有力的替代方案 “安全 C++”提案已被取消,凸显了在语言中添加强大安全功能所面临的持续挑战。虽然 C++ 委员会继续致力于“Profiles”(一种旨在逐步提高安全性的系统),但许多人认为这种方法不足以实现真正的内存安全,并且缺乏像 Rust 这样的解决方案的可组合性。 一个关键问题是 C++ 社区对安全的重视程度不足,这与 Rust 强大的安全文化形成了鲜明对比。最近的 CppCon 炉边谈话中,人们对委员会的优先事项和进展缓慢表示担忧。一些人认为 Profiles 专注于为了监管目的*看起来*安全,而不是实现真正的安全。 讨论还涉及替代方法,例如 scpptool 项目,该项目旨在通过静态分析实现安全,以及构建在 C++ 优势之上的更像 Rust 的语言的可能性。最终,对话强调了将安全逆向移植到像 C++ 这样复杂的语言中的困难,这使得许多人认为 Rust 是优先考虑内存安全的项目的更可行的选择。这场辩论也凸显了系统编程语言中性能、表达力和安全之间的紧张关系。

## 理解 Ruby 的 JIT 编译器 (YJIT & ZJIT) Ruby 的 JIT(即时编译)编译器,例如 YJIT 和更新的 ZJIT,通过将字节码转换为本机机器码来显著提高性能。然而,这个过程比简单的替换更复杂。Ruby 在每个方法的 ISEQ(指令序列)数据结构中保留字节码 *和* 编译后的代码。`jit_entry` 字段指向可用的编译代码;否则,Ruby 将解释字节码。 编译并非自动进行。方法会被分析 – 最初被解释,然后被监控 – 并且只有在达到特定调用阈值后(ZJIT 中目前是 25 用于分析,30 用于编译)才会进行编译。这段“预热”时间对于达到最佳性能至关重要。 然而,JIT 编译的代码并非万无一失。它依赖于对代码行为的假设(例如,数据类型)。如果这些假设被违反(例如,当它期望整数时,调用一个将浮点数作为参数的加法方法),代码会“反优化”,恢复到解释执行以确保正确的结果。激活 `TracePoint` 调试或更改核心方法等事件也会触发反优化。 这种动态方法在速度、安全性和效率之间取得了平衡,避免对很少使用的代码进行不必要的编译,并保证即使假设发生变化也能正确执行。 要深入了解,请参阅“ZJIT 已合并到 Ruby 中”和 Kevin Newton 的“Advent of YARV”系列。

## Ruby JIT 编译讨论于 Hacker News Hacker News 上进行了一场关于通过即时编译 (JIT) 提高 Ruby 性能可能性的讨论。Ruby 的动态特性给 JIT 编译器带来了挑战——由于运行时代码修改,需要不断验证假设——但一些评论员指出,.NET 和 JavaScript 引擎等其他虚拟机中已有的解决方案,使用后台编译(“分层编译”)。 核心争论在于 Ruby 是否能达到 JVM 的速度。许多人认为这不太可能,因为 Ruby 的设计优先考虑灵活性而非静态优化。然而,TruffleRuby 和 JRuby(在 JVM 上运行的 Ruby 实现)表明 Ruby *可以* 利用 JVM 的性能,尽管存在权衡。 其他提出的想法包括 Ruby 中的一个受限制的“子语言”,禁用动态特性以方便编译,或者一种机制,向 JIT 编译器发出信号,告知代码部分具有有限的动态性。讨论还涉及 VM 快照以加快启动时间,并承认 Ruby VM 开发与 JVM 之间的巨大投资差距。

经过四年的谜团,米歇尔·威利终于找到了2021年她婚礼上那个尴尬的陌生人。照片中那位身穿深色西装、表情窘迫的高个子男人,被确认为安德鲁·希尔豪斯,他错误地参加了错误的婚礼。 希尔豪斯急着赶往艾尔的婚礼,错误地跟着宾客走进了普雷斯威克卡尔顿酒店,误以为那就是正确的地点。直到另一位新娘走上红毯,他才意识到自己的错误,但还是觉得有必要留下,试图在仪式上融入其中。他甚至被婚礼摄影师拉去合影了! 一次脸书上的求助,经苏格兰内容创作者达扎的传播,促成了希尔豪斯的羞愧承认。他最终赶到了正确的婚礼,并成为了当晚的明星讲故事者。威利最初担心那个人可能是个跟踪狂,现在已经和希尔豪斯成了脸书好友,并很高兴解开了这个长久以来的谜题。

## 黑客新闻讨论总结:婚礼冒领者及相关话题 一个黑客新闻的帖子源于一个男人意外参加了一个婚礼,直到仪式开始后才意识到自己的错误。他为了不打扰活动而留了下来,甚至和这对夫妇合影了。这引发了一系列用户分享类似经历的轶事——参加了错误的活动、混淆了约会时间,或者发现自己身处尴尬的社交场合。 讨论很快蔓延到各种离题,包括关于西班牙语言和身份认同的争论(特别是加泰罗尼亚语与卡斯蒂利亚语),与类似事件的比较(比如一个人在被“解雇”后在苹果公司工作),甚至更广泛地讨论公司文化、员工权利和国家认同。 许多用户分享了与这些主题相关的个人经历,突出了文化差异和工作场所的体验。 最终,这个帖子表明,一个简单、 relatable 的故事如何能在黑客新闻社区中引发各种相关想法和经历,并且常常会深入到复杂而细致的讨论中。

## 查理·柯克遇害事件引发失业与审查 极右翼活动家查理·柯克遇害引发广泛 repercussions,导致多人因在社交媒体上发表批评柯克的言论而失业或受到 censure。教师、消防员、记者、政府雇员(包括一名特勤局特工和五角大楼工作人员),甚至一名 NFL 员工,因表达不利观点而被解雇、停职或调查。 在特朗普政府承诺对那些“赞扬”凶杀案的人采取行动的推动下,并受到保守派人士积极寻找“ objectionable”帖子 的助长,一股右翼愤怒浪潮随之而来。一些共和党人甚至提倡将柯克的批评者驱逐出境或永久封禁其社交媒体账号。 此次打击与过去的行径形成鲜明对比;许多现在表达愤怒的人过去曾嘲笑政治暴力的受害者。这一情况凸显了言论自由以及在线表达后果之间日益增长的紧张关系,公司和机构优先考虑 perceived loyalty 而不是开放辩论。 几个人声称他们的评论在激烈的反弹中被误解或断章取义。

## AI 必然出现的幻觉 OpenAI 的研究表明,“幻觉”——像 ChatGPT 这样的大型语言模型自信地陈述错误信息——并非错误,而是这些模型运作方式的数学上的*必然*结果。即使使用完美的数据进行训练,逐字预测文本的概率性质本身就不可避免地导致错误累积,从而导致比简单任务更高的错误率。 当前 AI 评估基准进一步加剧了这个问题,这些基准会惩罚不确定性,有效地奖励自信的猜测,而不是承认“我不知道”。这为模型*始终*回答创造了强大的动机,即使回答不正确。 虽然存在解决方案——例如模型量化自身的置信度,以及基准奖励诚实的模糊性——但它们面临着重大障碍。评估不确定性的增加计算成本使其对于需要快速、廉价响应的消费者应用来说过于昂贵。目前,商业激励措施优先考虑自信的答案和速度,而不是准确性,这意味着幻觉可能会在广泛使用的 AI 系统中持续存在。然而,对于准确性胜过成本的关键应用(例如金融或医学),采用感知不确定性的 AI 在经济上是可行的,也是必要的。

## OpenAI 研究:幻觉不可避免(且受惩罚) 最近一篇 OpenAI 的研究论文,在 Hacker News 上讨论,强调了防止大型语言模型 (LLM) “产生幻觉”——自信地提供错误信息——的固有挑战。核心问题在于,当前的基准测试*惩罚*模型表达不确定性(“我不知道”),激励它们猜测而不是承认局限性。 用户希望得到明确的答案,而经过训练以优先执行操作而非承认不确定性的模型,在领先的排行榜上表现更好。讽刺的是,基础模型通常比经过后训练的模型更“校准”(在置信水平上更准确)。 评论者提出了诸如单独的“自信”和“诚实”模式、新的基准测试系统,以及训练模型明确识别其知识边界等解决方案。然而,一个关键点是,LLM 被设计用来*回答*问题,不一定是为了准确评估它们自身回答问题的能力。最终,讨论的中心是事实准确性和用户体验之间的权衡,以及优先考虑自信(即使可能不正确)的回答是否在经济上有利。

关于按住版权联系我们创作者广告开发者条款隐私政策和安全性YouTube的工作原理测试新功能© 2025 Google LLC

基于能量的Transformer [视频] (youtube.com) 43点 由 surprisetalk 1天前 | 隐藏 | 过去 | 收藏 | 3条评论 cs702 1天前 | 下一个 [–] 我建议阅读主要作者的博客文章,而不是观看这个视频:https://alexiglad.github.io/blog/2025/ebt/ 另外,请参阅:https://www.reddit.com/r/MachineLearning/comments/1lu1ia0/r_...回复 programjames 1天前 | 父级 | 下一个 [–] TLDR;训练一个“能量”模型来检查输出是否正确(而不是直接输出),并使用梯度下降来寻找好的输出。使用Transformer。回复 tripplyons 1天前 | 上一个 [–] 我之前看过该频道的一些视频,其中很多都包含错误。我还没有阅读《基于能量的Transformer》论文,所以不能确定这个视频是否包含任何错误,但请小心。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

现代复杂系统——从互联网到供应链——并非源于宏伟设计,而是源于简单、可用的原型,并随着时间的推移不断迭代改进。尽管偏好“系统思考”和精细分析,但试图*控制*这些系统的尝试往往以惨败告终,例如HealthCare.gov和澳大利亚残疾人福利改革的代价高昂的失败就证明了这一点。 核心问题不是缺乏分析工具,而是对复杂系统行为方式的误解。它们抵抗操纵,干预往往会适得其反——这一原理类似于化学中的勒夏特列原理。成功的系统构建并不在于修复现有的复杂性,而在于从一个*简单*且可用的系统开始,并允许其演化。 美国洲际弹道导弹计划和爱沙尼亚的数字政府等例子证明了这一点:绕过现有的官僚机构,创建重点明确、负责任的新系统,取得了积极成果。即使像人工智能生成代码这样的进步也无法克服这一基本原则。随着系统变得越来越复杂,并可能超出人类控制范围,优先考虑简单、实用的开端,提供了最可行的前进道路——回归所有成功系统的起源。

## Hacker News 讨论“神奇的系统思维”总结 Hacker News 的讨论围绕一篇批评“系统思维”的文章展开,该文章认为它常常被误用且无效,尤其是在大型项目中。文章的核心观点——构建或修复复杂系统很困难——引发了争论。 许多评论者不同意文章对该领域的广泛否定,认为它歪曲了系统思维。他们指出,真正的系统思维*承认*模型的局限性,预见对变革的抵制,并专注于理解现有系统,而不是强加自上而下的解决方案。 许多人强调认识意外后果和反馈循环的重要性。 一个主要的争论点是作者是否攻击了一个稻草人——对系统思维的错误描述——这源于对官僚主义的负面经历。 另一些人认为,作者的批评源于对从头开始构建的偏好,这与该出版物的理念一致。 讨论还涉及了诸如控制论、复杂性理论以及实践应用与理论建模的重要性等相关领域。最终,共识倾向于系统思维是一种有价值但细微的方法,但常常受到误解和不切实际的期望的阻碍。

未来已来:LinHT 首次成功启动。我们相信软件定义收发机将是业余无线电的下一个大趋势。LinHT 是当今业余无线电领域最重要的硬件项目。Bruce Perens, K6BP https://perens.com/2025/08/12/whats-wrong-with-ardc/ 该测试设备没有射频放大器(尽管我们将在下一次修订版中包含 GRF5604 射频放大器,见此)。此测试设置的输出功率约为 5dBm。频率范围:420-450MHz (UHF)。尽管有些人怀疑这种设计是否可行,但我们坚持不懈地继续工作。特别感谢 Vlastimil OK5VAS 和 Andreas OE3ANC。没有你们的帮助,这个项目不可能实现。LinHT 快速初步预览。该设备是开源硬件。PCB 设计在这里提供。原型制作总成本:– PCBWay 的 PCB+组装费用为 490 美元(5 件)– Retevis C62 (供体)– SoM 费用为 469 美元,5 件。

一个新的开源软件定义无线电(SDR)业余无线电收发器原型正在业余无线电社区中引起关注(m17project.org)。Hacker News上的用户正在讨论它的潜力,特别是与FreeDV音频编解码器结合使用时,这可以显著提高数字通信的范围和清晰度。 讨论要点包括项目的模数/数模转换器、潜在的更宽带宽录制能力(例如整个2米频段)以及对现有SDR应用程序(如rtl_tcp_echo)的可能软件贡献。 成本是一个关键问题,预估零件费用在60美元左右,优化生产后零售价可能在100美元或更低。有人建议自行组装可以进一步降低成本,而另一些人指出进口关税会迅速推高已组装板的价格。500美元的初始投入被视为个人爱好者的障碍,但该项目让人想起业余无线电和计算中较早、更易于获得的套件构建机会。

德米斯·哈萨比斯,谷歌DeepMind的首席执行官和2024年诺贝尔奖得主,认为“学习如何学习”将是未来世代最重要的技能。他在雅典发表演讲时强调,人工智能驱动的变革速度前所未有,使得长期预测变得困难。他预计通用人工智能——具有人类水平能力的人工智能——可能在十年内到来,可能带来一个“激进的富足”时代,同时也伴随着内在风险。 哈萨比斯强调,除了传统的学术科目外,培养“元技能”——理解*如何*学习和适应——至关重要。在职业生涯中持续学习将是必不可少的。 希腊总理基里亚科斯·米佐塔基斯也出席了活动,他强调人工智能可能加剧金融不平等,并警告如果收益未能广泛共享,可能会引发社会动荡。他讨论了在政府服务中扩展人工智能的应用,同时也承认需要公平分配其优势。

## 486Tang:将486 PC移植到Sipeed Tang Console 开发者最近发布了486Tang v0.1,这是ao486 MiSTer PC核心移植到Sipeed Tang Console 138K FPGA的版本。这是ao486首次在非Altera FPGA上运行。 关键的调整包括切换到SDRAM作为主内存(采用“双泵”技术来弥补其16位宽度),并利用SD卡作为SD卡支持的IDE,因为Tang缺乏高速MCU接口。实现了一个引导加载程序,用于从SD卡加载必要的PC组件。 该系统的启动严重依赖Verilator进行快速的、全系统仿真,并借助调试钩子,利用Bochs BIOS调试输出和针对声音卡和IDE等子系统的定向跟踪来辅助调试。 最初的性能较低,约为25MHz,但通过优化——包括复位树的减少、指令提取的简化和TLB的修改——性能提高了35%,达到了大约486SX-20的水平。该项目突出了x86架构相对于更简单的RISC设计的复杂性,以及在FPGA开发中时钟速度扩展的重要性。

## 在FPGA上实现486:复古计算项目 一位开发者成功地在信用卡大小的FPGA板上实现了486处理器([nand2mario.github.io](https://nand2mario.github.io))。该项目使用DDR3 SDRAM用于视频,之所以选择它是因为与FPM或EDO内存相比,它更容易与软CPU配合使用,尽管这与486原始时代并不相符。目前,该实现使用了FPGA的44%的LUT和59%的BRAM。 讨论围绕内存选择展开,一些人指出DDR3在复古项目中的局限性在于时钟速度的限制。另一些人则探索其他兼容486的硬件,例如Via Eden板或AMD的Élan/Geode处理器,但承认它们的复杂性更高或已停产。 该项目引发了人们对在现代工艺中重现经典硬件的兴趣,以及构建能够运行较旧游戏(如DOOM)的小型低功耗系统的潜力。它还引用了Valve在E3演示中Half-Life 2中的一个幽默时刻,俏皮地暗示了该系统的能力。

更多

联系我们 contact @ memedata.com