每日HackerNews RSS

客户端挑战:您的浏览器已禁用 JavaScript。请启用 JavaScript 以继续。网站的必要部分无法加载。这可能是由于浏览器扩展、网络问题或浏览器设置造成的。请检查您的连接,禁用任何广告拦截器,或尝试使用不同的浏览器。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 太空竞赛被遗忘的主题公园 (jstor.org) 25 分,anarbadalov 1 天前 | 隐藏 | 过去 | 收藏 | 2 评论 帮助 chkaloon 22 小时前 | 下一个 [–] 很高兴提到迪士尼。在它成为皮克斯电影的营销部门之前,它曾是未来世界和后来的未来世界的一个充满乐观主义的绝佳场所。不幸的是,它已经失去了昔日的辉煌。回复 noworld 1 天前 | 上一个 [–] 就像《辐射》中的场景一样。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

一场关于价值连城的刚果矿产数据的争端正在比利时特尔弗伦的非洲博物馆酝酿。去年,刚果政府与得到杰夫·贝佐斯和比尔·盖茨支持的科博尔德金属公司达成协议,以数字化博物馆中详细记录该国丰富的钴、铜和钽矿藏的档案,旨在利用人工智能确定新的矿区。 然而,博物馆拒绝直接将档案移交给科博尔德金属公司,而是倾向于一个由欧盟支持的、与刚果地质部门合作的科学数字化流程。他们认为这些档案是公共财产,而非私人公司资产。 据报道,特朗普政府曾向博物馆施压,要求其向科博尔德金属公司提供访问权限,试图利用刚果的矿产财富。虽然美国大使馆与比利时官员进行了接触,但比利时目前支持博物馆的立场,强调与刚果正在进行的数字化工作,并反对私人实体获得独家访问权。这些档案本身包含比利时在刚果及周边国家矿业运营的历史数据,并且在获得刚果政府许可的情况下,已经可以供研究人员访问。

“数据有重量”的观念引发了对数据存储物理学的深入研究。 硬盘驱动器通过重新排列现有原子来存储数据——质量变化可以忽略不计——而固态硬盘(SSD)在填满时*确实*会从技术上讲增加重量。 这是因为SSD通过向存储单元添加电子来存储数据。 电子有质量(每个9.11 × 10^-31千克),一个1TB的SSD,在完全写入时,理论上由于添加的电子会增加约2.43皮克(2430飞克)。 这是基于存储单元的数量、每个存储单元的电子数量以及单个电子的质量计算得出的。 然而,这种重量增加非常小——小到目前的技术无法测量。 灰尘或温度波动的影响会更大。 虽然HDD无论数据多少都保持恒定的重量,但SSD会经历微小的理论质量增加。 这是一个有趣的思维实验,突出了信息与物理基本定律之间的联系,但最终,这并不是一个实际问题。

## SSD 数据与重量:黑客新闻讨论总结 一篇最近的文章声称 SSD 存储数据会增加重量,这在黑客新闻上引发了争论。核心论点在于,存储数据——特别是将电子困在 SSD 栅极中——是否真的*增加*了驱动器的质量。 大多数评论者同意原文的前提是错误的。虽然电子在数据存储过程中被添加/移除,但 SSD 内部的*总*电子数量保持不变;电子只是被移动,而不是被创造。为了避免灾难性故障,SSD 的净电荷必须保持为零。 讨论深入到物理学领域,指出虽然带电电容器*确实*存储能量(从而在理论上存储质量),但能量差异非常小——在飞克数量级。 几点被提出:数据编码通常平衡 0 和 1 以避免磨损,并且诸如外壳升华或灰尘积累等因素可能对质量变化产生更大的影响。甚至有人开玩笑地建议利用这一点来实现无质量推进! 最终,共识是,虽然数据存储*确实*涉及能量变化,因此*会有*一些质量变化,但这种变化可以忽略不计,并且很可能被其他物理过程所掩盖。

## 纽约法案旨在追究聊天机器人责任 一项纽约法案(S7263)即将提交参议院审议,旨在追究聊天机器人运营者因在14个持证职业(包括医学、法律和工程)中提供的不准确或有害“实质性”建议而承担法律责任,以及未经授权的法律执业。如果通过,面向消费者的聊天机器人部署者将面临民事诉讼和潜在损害赔偿,即使有免责声明。 该法案对“所有者”的定义非常广泛,不仅包括OpenAI等大型人工智能公司,还包括医院、非营利组织,甚至利用人工智能API的小团队。 担忧集中在未定义的术语“实质性”上,这可能会抑制有帮助的聊天机器人回复——例如总结法律通知或解释医学术语——以避免法律风险。 批评者认为,该法案于2026年初起草,未能反映人工智能安全方面的最新进展,并可能不成比例地损害那些依赖经济实惠、易于获取的信息的人。 它还引发了关于言论自由和潜在事先审查的第一修正案问题。 法案生效后90天的时间窗口将迫使聊天机器人功能快速变化,预计会出现法律挑战。 该法案可能会显著重塑纽约人工智能信息获取的格局。

## 纽约考虑限制聊天机器人提供建议 纽约正在考虑一项法案,该法案可能禁止聊天机器人提供医疗、法律或工程建议。争论的中心在于潜在的不准确或有害信息,以及人工智能提供错误指导时缺乏问责制。 支持者认为这可以保护消费者,而反对者则认为这会阻碍信息获取,特别是对于那些无力支付专业服务的人。人们担心现行法律已经解决了未经授权的执业和欺骗行为,而该法案可能会扼杀创新和有用的消费者指导。 一个关键的争议点是,聊天机器人是否应该被要求达到与持照专业人士相同的标准,还是应该被视为像搜索引擎一样的信息工具。一些人认为问题不在于提供的信息,而在于聊天机器人可能产生的专业知识印象。另一些人强调人工智能可以 democratize 知识获取的潜力,为缺乏资源的人提供“总比没有好”的替代方案。该法案还面临批评,因为它可能为虚假诉讼打开大门。

## 内核漏洞分析:人为因素 – 摘要 本分析基于第一部分关于12.5万个内核漏洞的研究,调查*谁*引入漏洞,*何时*引入,以及如何改进流程。虽然漏洞的平均寿命为2.1年(竞争条件持续时间超过两倍),但关注人为因素揭示了关键见解。 值得注意的是,117位“超级审查者”发现漏洞的速度几乎是其他人的两倍。作者自行修复漏洞的速度是他人修复的三倍,突显了代码所有权的重要性。令人惊讶的是,周末提交的代码*更少*包含漏洞(-8%),但由于审查覆盖减少,修复时间长45%。 英特尔贡献了最多的漏洞,与他们的代码量成比例(提交代码的8.4%,约占漏洞的11%)。分析还表明,优先处理低关注子系统(如drivers/can)至关重要,因为那里的漏洞持续时间最长。 流程改进 – 将提交路由给超级审查者,提高提交消息质量,利用子系统特定模型,以及根据时间调整CI/CD – 可能会将平均漏洞寿命缩短35%。该研究强调,虽然VulnBERT等自动化工具很有价值,但利用人类专业知识和培养代码所有权对于内核安全至关重要。

## 黑客新闻讨论:分析 Linux 内核漏洞 一篇最近的博客文章(pebblebed.com)分析了 125,000 个内核漏洞,在黑客新闻上引发了争论。文章的核心发现——识别漏洞作者——引发了关于企业与个人贡献者角色的讨论。 文章认为个人贡献者仍然很活跃(使用个人/大学邮箱),但评论员质疑数据的准确性,指出员工可能使用个人邮箱工作,导致分类错误。 一些用户批评了分析的统计严谨性,认为相关性不等于因果关系,并告诫不要得出明确的结论。人们对使用漏洞数量来评估开发人员表示担忧,甚至有人开玩笑地说要“解雇”引入最多漏洞的开发者(包括 Linus Torvalds!)。 进一步的讨论集中在代码贡献的复杂性差异上——企业贡献往往更大,可能增加漏洞表面积——以及不同子系统(如用于关键基础设施的 CAN 总线驱动程序)中漏洞严重程度的差异。有人推测企业甚至可能*故意*引入漏洞。最终,这场对话凸显了从此类数据中提取可操作见解的难度。

## 优化C代码以适应CPU能力 当软件性能严重依赖于CPU特性时,在最大化速度的同时实现可移植性是一个挑战。关键在于利用编译器优化,而不是依赖于保证的ISA可用性。 像GCC和Clang这样的编译器可以针对特定的CPU架构(例如`-march=znver3`),自动利用可用的指令集来提高性能。Intel定义了微架构级别(v1-v4)来分类CPU能力,为优化提供了一个基线。您可以为最低公共分母(现在可能是v3/v4)构建,或者为较新/旧的处理器创建单独的构建。 为了更精细的控制,**间接函数 (IFUNCs)** 允许动态链接器在运行时选择最佳函数版本。现代编译器(带有C23的GCC/Clang)甚至可以使用诸如`[[gnu::target_clones("avx2,default")]]`之类的属性来自动执行此过程,自动创建AVX2和默认版本。 当自动矢量化失败或需要特定的内在函数时,需要手动优化。这涉及创建可移植的和优化的(例如,AVX2)版本,并使用`#ifdef __AVX2__`或编译器pragma (`#pragma GCC target("avx2")`)有条件地编译。运行时CPU检测 (`__builtin_cpu_supports("avx")`) 然后调度到适当的函数。 虽然功能强大,但这些技术也有局限性——MUSL libc缺乏IFUNC支持,并且由于编译器限制,Windows支持具有挑战性。

这个Hacker News讨论围绕着使用动态特性检测来优化C代码性能——根据可用的CPU能力调整代码执行。原始帖子链接到一个gist,详细介绍了这种方法。 一个关键点是,通过编译器优化(-O2/3)自动利用高级指令集(SSE/AVX)*是否*真的能提高速度,或者由此产生的代码膨胀是否会因缓存效率低下而对性能产生负面影响,尤其是在资源受限的环境中,例如嵌入式系统。 另一位评论者指出,GCC和Clang已经通过intrinsic headers提供了函数多版本化,自动处理目标选择,无需手动分派。最后,有人提到微软历史上更偏爱C++而不是C,尽管Visual C++在C标准支持方面最近有所改进。

(Empty input provided. There is nothing to translate.)

## Flock摄像头地图与讨论总结 一篇Hacker News讨论围绕一张新的交互式地图([deflock.org](https://deflock.org))展开,该地图详细显示了Flock Safety车牌识别器的位置。用户对广泛的监控表示担忧,指出这些摄像头在许多地区普遍存在,通常在购物中心甚至整个社区附近。 争论的焦点在于公共安全与隐私之间的平衡。一些人认为这些摄像头有助于预防和解决犯罪(例如车辆盗窃),而另一些人则担心潜在的滥用——包括跟踪、执法部门的滥用以及创建一个普遍存在的监控国家。人们对数据安全以及数据可能被用于超出犯罪调查目的之外的用途表示担忧。 一些用户强调了贡献地图的能力,甚至可以从OpenStreetMap数据中删除摄像头。另一些人指出了访问收集到的数据的法律途径,以及即使在现有法规下也可能存在的滥用可能性。讨论还涉及这些系统与减少犯罪的替代方法(例如解决贫困问题)的有效性。最终,这场对话凸显了人们对现代社会可接受的监控水平存在深刻的分歧。

## 抽象与系统可靠性:关于 Oberon 项目的思考 本摘要反映了 Oberon 项目文档的第一部分,重点关注抽象在软件可靠性和正确性中的作用。作者认为,虽然抽象对于管理系统*内部*的复杂性很有用,但它们最终*会阻止*保证*系统层面*的可靠性。抽象隐藏了实现细节,关键属性(如性能)常常在这种简化中丢失。真正的系统层面理解需要直接检查底层组件, “穿透抽象的面纱”。 该文档提出了一种独特的系统演进方法:与其用新功能扩展现有抽象(导致“稀疏”或弱化的抽象),不如创建新的抽象。这允许系统有机增长,支持新功能而不会损害现有接口。虽然这可能会增加需要管理的抽象数量,但作者认为可以通过非破坏性更改和改进的工具来缓解。 最后,作者指出 Oberon 中的一种约定——复数模块名表示抽象数据类型——引发了对在编程语言中用含义重载名称的做法的思考,这可能源于使用纯文本编写代码的限制。

## Oberon 项目与抽象的价值 - Hacker News 讨论总结 一篇来自 sidhion.com 的文章引发了 Hacker News 的讨论,内容围绕软件设计中抽象的优缺点,并提及 Oberon 系统。一个关键点是 Oberon 独特的“Text”抽象数据类型,它允许在源代码中使用丰富的文本格式(如斜体),*而不会*影响编译器解析它的能力——展示了强大的抽象能力。 对话迅速转向关于抽象何时有帮助的争论。一些人认为抽象会阻碍对“整个系统”的理解,并且可能有害,尤其是在遇到错误或性能问题时。另一些人则认为抽象对于管理复杂性至关重要,能够实现“分而治之”的方法并定义清晰的模块契约。 许多评论者强调了*良好设计*抽象的重要性,指出糟糕实现或不恰当应用的抽象可能会使问题恶化。讨论还涉及模块化编程的历史背景(面向对象编程的前身)以及了解何时抽象不再足够的问题。最后,一个怀旧的支线话题透露,游戏 *Oxyd* 实际上是用 Modula-2 编写的,这是一种与 Oberon 相关的语言。

## NanoGPT Slowrun:提升人工智能的数据效率 Q Labs 的“NanoGPT Slowrun”是一个开源项目,专注于开发数据高效的学习算法。该项目认识到,数据而非计算将成为人工智能发展的主要瓶颈(不同于当前语言模型的趋势),因此它挑战研究人员在固定的 1 亿 token 数据集上,利用*无限*的计算资源,实现最低的验证损失。 这与典型的“速度竞赛”基准测试形成对比,允许探索计算成本高昂但可能具有影响力的技术,例如强正则化和替代优化器。初步结果令人鼓舞:社区贡献已经实现了比标准 NanoGPT **5.5 倍的数据效率**,从 2.4 倍的基线水平提升。关键改进包括 epoch 洗牌、学习投影和激活函数交换。 该项目短期目标是实现 **10 倍的数据效率,并有可能在年底前达到 100 倍**,重点关注二阶优化器、扩散模型和课程学习等领域。Q Labs 鼓励通过其开放仓库进行贡献和协作。

## NanoGPT 慢速运行:关注数据效率 一个名为“慢速运行”(qlabs.sh)的新项目正在探索使用有限数据但*无限*计算量的语言建模。其核心思想是提升数据效率——从固定数据集中能提取多少信息——而不是关注速度,后者是常见的基准假设。 该项目基于最近的研究(包括斯坦福大学的一篇论文),利用积极的正则化和集成技术。讨论的重点是比较自回归(AR)模型与扩散模型等方法,以及二阶优化器的潜力。参与者也在探索通过LLM创建的任务和解决方案来生成自训练数据。 该项目承认过拟合的风险,并计划通过不断演化的验证集来解决。它也与BabyLM挑战进行比较,不同之处在于它强调计算驱动的数据效率和更广泛的预训练范围。团队正在尝试通过对多个训练模型的logits求平均来进行集成,类似于“模型汤”技术。目标是缩小当前模型与人类样本效率之间的差距。

MOSS 是一款具有生动笔触的像素编辑器。使用混合、扩散、滴落、生长和故障等工具进行绘画——每种工具的行为都不同,并且可以完全自定义。MOSS 画布的每个单元格都是一小块数据,可以被笔触操纵。颜色累积,图案显现,而美好的意外可能会变成你最喜欢的作品。它是一种让你坐下五分钟,却不知不觉一个小时就过去了的玩具。MOSS 预装了 50 多种笔刷,从简单的油漆和墨水到疯狂的藤蔓生长、湿滴和生成式格子等。不喜欢某个笔刷的工作方式?调整它!每个笔刷都是可编程的——改变它的扩散方式、它留下的东西以及它对颜色的反应。完成创作后,保存你的作品并与朋友分享。任何人都可以用相同的笔刷和调色板在 MOSS 中打开你的图像进行游玩。

## MOSS:可编程像素艺术 MOSS (moss.town) 是一种新颖的绘图工具,每个画笔都是一个微型程序,允许创建高度可定制和动态的像素艺术。用户使用代码定义画笔行为,影响随机性、图案和压力敏感度等方面。这使得画笔能够模拟喷漆罐等真实工具,或创建不断演变的形状和效果。 该项目由 heyitsgarrett 创建,灵感来自 Aseprite 和 Pico-8 等工具。用户正在分享画笔代码并探索 API,已经实现了“梦想填充”工具等功能。一个关键特性是能够将作品作为 PNG 图像分享,同时编码所使用的画笔,类似于 PICO-8。 最近的更新包括添加了 Shift 键支持以绘制直线,以及改进了触摸处理。社区对此充满热情,将其与 Krita 和 ShaderToy 等工具进行比较,并讨论了程序化生成甚至在画笔中嵌入简单游戏等潜在扩展。

更多

联系我们 contact @ memedata.com