每日HackerNews RSS

启用 JavaScript 和 Cookie 以继续。

## OpenAI 收购 Astral:开源 Python 生态系统面临担忧 OpenAI 收购了 Astral,该公司是流行的 Python 工具(如 `uv` 和 `ruff`)的开发者,这在开发者社区引发了争论。虽然一些人认为这可能带来好处,但许多人对这些开源项目的未来表示担忧。 一个主要担忧是开源开发对风险投资的依赖,这可能导致大型公司收购,而这些公司具有不同的优先事项。一些人认为 Astral 的风险投资使其退出成为必然,而由基金会支持的模式可能提供更稳定的保障。另一些人指出,Astral 在其开源工作之外,还在构建一个盈利的企业包托管系统。 尽管 OpenAI 和 Astral 保证开发将继续进行,但开发者担心“劣质化”——工具可能被锁定或商业化。有一种观点认为,在 Anthropic 收购 Bun 之后,这次收购标志着人工智能公司收购有价值的开发者工具的趋势。人们仍然希望社区可以在必要时分叉项目,但对 Python 生态系统和更广泛的开源格局的长期影响仍然感到担忧。

Ticketmaster和LiveNation在活动入场处对人脸识别技术的投资,出现了一个意想不到的弱点:Juggalo妆容。Insane Clown Posse的粉丝,以其独特的面部彩绘而闻名,无意中扰乱了这项技术。 大多数人脸识别软件依赖于识别对比鲜明的特征,如眼睛、鼻子和下巴。Juggalo妆容,其突出的黑色条纹遮盖了嘴巴和下巴,通过改变关键面部标志物和错误读取下颌线,扰乱了这些系统。 然而,这种解决方法并非万无一失。苹果的Face ID,利用深度感知而非表面对比,*仍然*可以识别化着Juggalo妆容的人。尽管有此限制,这种独特的审美为许多常见的人脸识别程序提供了一种意想不到的防御,可能允许Juggalos绕过LiveNation的新安全措施。

## Juggalo妆容与面部识别:黑客新闻讨论 一篇2019年的文章引发了黑客新闻的讨论,内容关于Juggalo妆容——嘻哈组合Insane Clown Posse的粉丝所佩戴的独特面部彩绘——扰乱面部识别技术的能力。最初的帖子将其强调为一种潜在的、非常规的规避监控的方法。 讨论迅速演变成一场关于技术对抗措施与系统性解决方案(如限制监控的宪法修正案)有效性的更广泛辩论。许多评论者认为,法律框架至关重要,因为技术不断发展,形成军备竞赛。 几位用户指出,仅仅依靠视觉干扰的局限性,并注意到步态分析和其他生物识别追踪方法正在兴起。其他人建议采取替代方法,例如反识别服装,甚至通过佩戴口罩等方式拥抱匿名性。一个反复出现的主题是监控的日益普遍——从Ring摄像头到手机应用程序——以及扭转这种趋势的难度。 最终,该帖子反映了对数字时代隐私侵蚀的犬儒、幽默和真切担忧的混合,并伴随着令人惊讶的大量对ICP和Faygo的怀旧参考。

Astral 公司,即 Ruff、uv 和 ty 等热门 Python 工具的开发者(月下载量达数亿),将加入 OpenAI 的 Codex 团队。这一举措源于 Astral 的核心使命:大幅提升编程效率。 创始人认为,人工智能,特别是通过 Codex,代表着实现这一目标的下一个前沿,提供的杠杆作用甚至大于仅仅改进现有的 Python 生态系统。重要的是,OpenAI 承诺将*继续*支持 Astral 的开源工具,并保持以社区为中心的发展方式。 该团队将专注于将他们的工具与 Codex 集成,并探索软件开发的未来,同时坚持他们的原始使命。创始人对 Astral 团队、投资者和用户表示感谢,感谢他们的支持和信任,并承诺继续致力于构建有影响力的工具。

## OpenAI 收购 Astral,Python 工具创建者 OpenAI 收购了 Astral 团队,该团队开发了流行的 Python 工具,如 `uv`、`ruff`、`ty` 和 `pyright`。此举引发了技术社区的讨论,人们对这些开源项目在公司所有权下的未来表示担忧。 许多评论员认为这是 OpenAI 在 Python 生态系统中获取“影响力”并增强其“代理开发”能力的战略举措,可能会将这些工具与 Codex 集成。一些人担心此次收购遵循了大型人工智能公司收购有前景工具的模式,可能导致“劣化”或停滞。 尽管存在担忧,但也有人持乐观态度,希望此次收购能够为这些项目提供资金和长期的可持续性,即使必要时通过分叉也能继续维护和开发。 还有关于 OpenAI 更广泛的策略,即控制软件开发生命周期以及对开源可持续性的影响的讨论。 尽管未来仍不确定,但此次收购凸显了人工智能行业权力日益集中以及对更广泛开发者格局的影响。

现代处理器利用分支预测来高效地每周期执行多条指令。这种预测并非完美,准确性会影响性能,尤其是在基准测试期间。一个涉及循环和随机条件语句(如果一个值是奇数)的基准测试可以显示处理器学习分支模式的能力。 测试表明,处理器在重复运行并使用一致的随机数据后可以“记住”分支结果。AMD 的 Zen 5 处理器表现出最强的学习能力,准确预测了 30,000 个分支。Apple 的 M4 紧随其后,为 10,000 个,而 Intel 的 Emerald Rapids 则落后,为 5,000 个。 作者指出,该基准测试突出了不同处理器架构之间分支预测性能的显著差异,对 Intel 的结果表示失望,并赞扬了 AMD 的进步。该测试的源代码是公开可用的。这表明基准测试结果可能因处理器特定的优化(如分支预测)而产生偏差,尤其是在使用小型或重复数据集时。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 [重复] 你的CPU能预测多少分支? (lemire.me) 123 分,ibobev 1天前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 tomhow 1天前 | 下一个 [–] 评论已移动至 https://news.ycombinator.com/item?id=47432779.回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 海象与一位Python国王的陨落 2018年7月,关于一个新的Python操作符——`:=`(非正式地称为“海象”)的争论,导致了Python的创造者和“终身仁慈的独裁者”Guido van Rossum卸任,结束了近三十年的领导。该操作符旨在通过允许在表达式中进行赋值,来减少循环和条件检查等常见编码模式中的冗余。 然而,这项提议在Python社区内引发了激烈的争论。反对者认为它违反了Python之禅的清晰和简洁原则,担心它会引入歧义,并类似于C等可读性较差的语言。尽管务实主义者提出了强有力的论据,强调其带来的实际好处,但该讨论的争议性和随之而来的个人攻击让van Rossum感到精疲力尽。 他的离职引发了一场治理危机,最终在2019年成立了一个由五人组成的指导委员会,取代了BDFL模式。虽然“海象”操作符本身只是一个微小而有用的语言补充,但这一事件凸显了开源治理的挑战以及创始人的愿景与社区共识之间的微妙平衡。Python的故事表明,即使是微小的改变也可能暴露关于一个社区如何在超越其原始领导者之后发展和治理自身的根本问题。

请启用 JavaScript 并禁用任何广告拦截器。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Afroman 赢得了民事诉讼,起因是他音乐视频中使用了警察突袭的录像 (nytimes.com) 385 分,来自 pseudolus 1 天前 | 隐藏 | 过去 | 收藏 | 3 条评论 帮助 josefritzishere 1 天前 | 下一个 [–] 相关:https://news.ycombinator.com/item?id=47436950 回复 dang 1 天前 | 父级 | 下一个 [–] 评论已移至此处。谢谢!回复 ChrisArchitect 1 天前 | 上一个 | 下一个 [–] [重复] https://news.ycombinator.com/item?id=47436950 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

请启用 JavaScript 并禁用任何广告拦截器。

## 霍尔木兹海峡中断威胁美国国防能力 现代战争研究所的最新分析强调了美国国防准备中一个关键且 largely 未解决的漏洞:源于霍尔木兹海峡不稳定的供应链中断。 封锁正在造成“瘫痪”的影响,尤其是在硫磺方面——这是提取关键矿物(如铜和钴)的关键成分。 海上硫磺贸易已“几乎完全”中断,导致价格同比上涨 165%。 这些矿物对于制造和维修军事设备至关重要,从喷气发动机到雷达系统。 即使在当前冲突的早期阶段,更换损坏的设备也需要大量的铜——可能超过市场供应量。 这种“前勤务危机”因美国国防承包商供应链缺乏透明度而加剧;只有 6% 的供应链被完全绘制出来。 专家警告说,对不透明系统的依赖限制了军队补充资源的能力,并可能大幅增加战争成本,甚至使武器更换价格翻倍或更多。 这种情况超出了军事应用范围,可能会影响化肥生产和全球粮食安全。

## 霍尔木兹海峡封锁与美国国防工业 - Hacker News 摘要 一篇《卫报》文章引发 Hacker News 讨论,认为对霍尔木兹海峡的潜在封锁可能由于供应链漏洞,特别是硫磺供应问题,严重影响美国国防工业。然而,评论员们大多对文章的危言耸听的语气表示反对。 许多人认为该报告夸大了风险,理由是存在替代供应来源、储备以及中国将受到不成比例的影响。一些人指出,美国并不严重依赖经由该海峡运输的石油,而且中国拥有煤炭等替代能源。 一个关键问题是美国国防承包商供应链缺乏透明度,仅有 6% 的公司拥有完全可追溯的供应链。这种不透明性使得评估真实影响变得复杂。 许多评论批评当前政府对局势的处理,认为未能听取先前的军事规划和关于与伊朗冲突后果的警告。 此外,人们对文章缺乏具体数据和依赖权威表示怀疑。 最终,讨论的中心是美国是否为这种情况做好了充分准备,以及当前的政策执行是否反映了从过去中东冲突中吸取的教训。

Shubham Bose 的文章《49MB 的网页》详细描述了浏览大型新闻网站时日益令人沮丧和臃肿的体验。Bose 演示了像《纽约时报》和《卫报》这样的网站如何将广告收入置于用户体验之上,导致页面充斥着广告、自动播放视频和持续的干扰——有时仅留 11% 的屏幕用于实际内容。 这并非技术限制,而是由“可观看性”和“停留时间”等指标驱动的 deliberate 设计选择,通过让用户被困在网站上以最大化广告收入。作者认为这从根本上说对读者是*对抗性*的,与印刷版的设计形成了鲜明对比。 互联网的独特之处在于,它正被运营者主动破坏,优先考虑短期收益而非长期参与。这导致一个恶性循环,糟糕的体验会驱使用户离开,促使出版商添加*更多*侵入性元素,最终损害媒介本身。Bose 的分析强调了一种令人不安的趋势,即出版商似乎在主动鄙视他们运营的互联网。

## 用于增强语言模型的神经细胞自动机 研究人员发现,使用**神经细胞自动机 (NCA)** 数据(由神经网络生成的演化模式)预训练语言模型,在性能上出人意料地优于传统的自然语言预训练,即使在数据规模明显较小的情况下也是如此。NCA 生成多样化的、基于规则的序列,迫使模型**推断潜在模式**(上下文学习),而不是依赖于自然语言中存在的语义捷径。 具体而言,16400万个 NCA token 始终优于相同数量的自然语言 (C4) 和其他合成数据,在网页文本、数学和代码任务中均表现更好,perplexity 更低,收敛速度更快。即使 C4 扩展到 16 亿个 token,NCA 仍然具有竞争力,表明**每个 token 的多样性和规则推断比单纯的数据量更重要。** 关键在于注意力层,它捕捉可迁移的计算基本单元。NCA 的复杂性可以调整——代码使用更简单的规则,数学/文本使用更复杂的规则——从而优化性能。这项研究表明,未来的基础模型可以在获取语义*之前*从合成数据中学习推理,从而可能减少偏差并提高效率。

## 使用神经网络细胞自动机预训练语言模型 - 摘要 一篇最近的Hacker News帖子讨论了一种使用神经网络细胞自动机(NCAs)预训练语言模型的新方法。核心思想是摆脱对语言*语义*的依赖来进行初始训练,转而关注其*结构*。该假设认为,学习序列生成的底层规则,无论含义如何,都可以建立强大的推理能力。 一些评论员将其与之前的迭代随机计算和“预预训练”方法相提并论。另一些人则探讨了与生物系统的联系,暗示与视觉皮层发育和神经系统生长中观察到的反馈循环相似。 一个关键点是,智能是否根本需要自然语言,例如章鱼和乌鸦通过具身推理等不同方式展示了智能。讨论还涉及在模拟环境中的合成数据上训练模型的可能性,以及将这种“物理智能”与LLMs集成的挑战。最终目标是创建能够从合成数据进行推理,*然后*学习语义的基础模型,从而可能避免固有的偏见。

更多

联系我们 contact @ memedata.com