每日HackerNews RSS

## 为代理编码者构建:优先考虑“良好代码” 随着人工智能代理成为编码伙伴,传统的“可选”软件工程最佳实践现在变得*至关重要*。代理缺乏人类从错误中轻松恢复的能力,需要强大的安全保障。该团队的经验突出了成功集成代理的关键投资。 **核心原则:** 他们强制执行**100%代码覆盖率**——不是为了防止错误,而是为了保证代理验证的行为在*每一行*代码上。这消除了歧义,并提供了一个明确的测试“待办事项”列表。他们还优先考虑**清晰的代码组织**,使用描述性的文件名和小型、范围明确的文件来帮助代理加载上下文。 **自动化环境:** 快速、自动化的开发环境至关重要。一个命令启动隔离的工作树,并配置必要的设置,从而实现快速迭代。这需要快速测试(一分钟内带有缓存的 10,000+ 断言)以及通过代码检查器/格式化程序自动执行标准。 **强类型和数据完整性:** 使用 TypeScript 和强大的数据库类型(带有触发器的 Postgres)可最大限度地减少错误,并提供自文档代码。语义命名约定可以增强代理的理解。 最终,投资这些“良好代码”实践不是一种负担,而是解锁代理编码全部潜力的基础步骤。

## AI 与代码质量:摘要 这次 Hacker News 的讨论围绕着一个观点,即使用 AI,特别是大型语言模型 (LLM),正在*迫使*开发者编写更好的代码。核心论点并非 AI 编写完美的代码,而是为了从 AI 获得有用的结果,开发者需要优先考虑清晰性、彻底的测试(目标是 100% 覆盖率)和正式规范。 许多评论者指出,LLM 擅长*实现*明确定义的任务,但难以处理歧义或糟糕的代码基础。这促使开发者转向更严格的编码实践,例如在编码开始*之前*进行全面的测试套件和详细的规范。一些人甚至使用形式化验证工具,如 TLA+,为 AI 创建精确的规范。 关于 100% 测试覆盖率的可行性和是否总是受益,存在一些争论,但共识倾向于认为,AI 开发施加的约束——需要清晰、可测试的代码——最终对软件质量是积极的。 讨论还涉及 AI 能够加速开发的可能性,但告诫不要盲目依赖它,并强调持续的人工监督和架构思考的重要性。

11月21日,卡尔达诺区块链因一笔利用旧版节点软件已知漏洞的交易而发生重大分叉。责任人承认,他发起此问题是为了个人挑战,并受到有缺陷的AI生成指令的误导,无意中阻塞了网络流量。 尽管链很快恢复,卡尔达诺创始人查尔斯·霍金森公开指责该个人发动了恶意、预谋的攻击,声称他在Discord服务器内策划了数月,旨在损害卡尔达诺的声誉。他还声称FBI已经展开调查。 霍金森的回应以及执法部门的介入引发了争议,导致一名IOG工程师辞职,表达了对潜在严重后果的担忧——包括可能发生的突袭,针对无意错误和在线批评。该事件凸显了卡尔达诺社区内围绕安全测试、负责任的AI使用以及网络中断处理的紧张关系。

## Trust Wallet 被黑与加密货币安全问题 近期,币安旗下 Trust Wallet 扩展程序遭到黑客攻击,导致用户损失 700 万美元,引发了 Hacker News 上关于加密货币固有风险的讨论。该事件凸显了一个反复出现的问题:保护加密资产充满危险,无论用户自行管理密钥(容易丢失/被盗)还是依赖第三方托管人(容易遭受黑客攻击或诈骗)。 评论员将这些风险与传统、政府担保的银行存款进行了对比,指出它们提供的责任和安全性。虽然加密货币的去中心化特性对某些人具有吸引力,但也意味着出现问题时补救措施有限。人们对加密交易的匿名性(或缺乏匿名性)以及起诉在传统管辖范围之外运营的实体所面临的困难表示担忧。 讨论还涉及在现有网络基础设施中保护加密货币的技术挑战,建议需要超越网络浏览器的替代交互方式。尽管存在风险,一些人仍然对底层技术抱有信心,而另一些人则认为加密货币是不受约束的自由市场中的一次有缺陷的实验。币安承诺向受影响的用户进行赔偿,但有关此类承诺的可行性和可靠性的问题仍然存在。

作者探讨了将“静态分配”技术——虎蜂数据库用于避免运行时内存分配的技术——应用于编译器设计。虎蜂数据库的方法并非真正静态,而是基于命令行参数在启动时分配所有必要的内存,然后不再进行进一步分配。 关键见解在于,当处理有限的输入和输出时,静态分配是可行的。虽然编译器处理任意大小的代码和输出,但作者建议将编译视为流处理:处理有限的代码块并将结果累积到预先分配的“输出区域”。 即使处理大文件,这也能限制*进程*本身的内存占用(潜在上限可配置,例如4MiB)。可以使用索引代替指针来处理输出数据,从而简化持久化。作者认为,将O(N)输出与O(1)中间处理分离,可以带来更简单、更健壮的编译器架构,从而体现出与虎蜂数据库等数据库系统相同的优势。

## 编译器静态分配 - 摘要 最近 Hacker News 的讨论集中在编译器设计中的静态分配概念上——旨在消除动态内存分配,以实现更快的、更可预测的性能。核心概念是为编译器进程预定义内存限制,处理适合这些限制的代码块。 然而,评论者指出了一些挑战。简单地限制大小(例如将字符串长度限制为 256 字节)会导致浪费空间(如果大多数字符串更短),或者在字符串更长时导致失败。现代编译器通常采用“短字符串优化”和分配池来缓解这个问题。 人们对在没有动态分配的情况下处理文件间依赖和语义分析的复杂性表示担忧,并提到了历史上较慢的编译器方法。还有人质疑这种方法是否真正简化了代码,认为它增加了内存管理和记录的开销。 讨论还涉及实际限制——有人建议代码库限制为 2GB,而另一些人则强调使用大型编译单元(8GB+)在 AAA 游戏引擎等项目中的性能优势。最终,这个想法被探索为一种潜在的优化,但同时也承认了权衡和复杂性。

## 为末日做准备:从宗教劫难到科技亿万富翁的逃离 本文考察了文化中日益增长的为全球灾难做准备的迷恋,追溯了一条线,从《末日余生》系列的大获成功——它将基督教劫难描绘成一种字面意义上的生存场景——到当代“生存主义者”文化以及科技精英们雄心勃勃、常常是反乌托邦的项目。 虽然《末日余生》普及了一种植根于福音派基督教的技术化生存主义,但对社会崩溃的焦虑已经扩大。今天,个人建造掩体并储备资源,反映了冷战的复兴,而真人秀则展示了极端的生存准备。这种趋势受到经济不稳定、环境问题以及普遍的不安感的影响。 然而,本文认为,这种准备随着世界上最富有的人而发生了特别令人不安的转变。像埃隆·马斯克和彼得·蒂尔这样的人物并没有专注于*解决*地球的问题,而是专注于*逃离*它们——通过太空殖民、像生物圈2号这样的自给自足的栖息地以及技术先进的堡垒。这反映了一种加速主义哲学,拥抱崩溃是不可避免的,并优先为少数人提供生存保障,回响着一种虚无主义的“劫难”,为技术特权阶层服务。这些项目由利润和对技术至上的信念驱动,最终揭示了对地球及其大多数人口命运的愤世嫉俗的脱离,为未来做准备,只有那些准备好的人——以及富有的人——才能生存。

## 遗留:摘要 这个Hacker News讨论围绕一篇2019年的文章,探讨了对“未来主义迷恋”中抛弃地球的现象,并将其与生存主义、加速主义和虚无主义联系起来。文章认为,像埃隆·马斯克和彼得·蒂尔这样的富人正在精神上为社会崩溃做准备,并寻求逃生路线,这反映了一种与福音派基督教历史上末日心态相似的思维。 评论者争论“劫难”概念的起源和有效性,指出这是一种相对较新的神学发展,并非早期基督教的核心教义。许多人批评这篇文章泛泛而谈,并在不存在意义的地方赋予意义,特别是关于苹果总部设计的部分。 讨论的一个关键要点是区分那些*等待*末日来临的人(福音派)和那些*有能力可能创造*末日的人——一群被描述为脱离现实,并被逃避自身行为后果的愿望所驱动的人。一些评论员认为这种行为源于“富人精神病”——破坏性行为与在其他地方重新开始的幻想之间的脱节。最终,讨论强调了对技术逃避主义转移人们对地球问题的关注的担忧。

Please provide the content you want me to translate. I need the text to be able to translate it to Chinese.

一项最新研究(链接为osf.io)考察了大型语言模型(LLM)中存在的文化偏见。该研究质疑LLM能够反映“人类”表现的假设,认为人类是极其多样化的,而LLM主要在不能代表这种多样性的数据上进行训练。 研究发现,LLM的回答与来自西方、受过教育、工业化、富裕和民主(WEIRD)社会的受访者最为接近,与更广泛的跨文化数据相比则存在显著差异。这种“WEIRD偏见”引发了科学和伦理方面的担忧。 评论员们讨论了这种偏见的必然性——LLM反映了它们的训练数据——并辩论了LLM中反映的当前“古典自由主义”价值观在历史背景下是否是积极的结果。另一些人指出,训练数据中也存在固有的西方虚伪现象。这项研究强调了在未来的LLM开发中解决和减轻这些偏见的需求。

## 程序员持续的需求 在计算机编程领域工作了43年,见证了无数“程序员末日”的预测,有一点很明确:这个职业始终在反弹和扩张。从早期的Fortran语言到最近的无代码平台和现在的大语言模型(LLM),每一波都承诺自动化,最终都*增加了*对技术开发人员的需求——这是Jevons悖论的一个典型例子。 虽然目前LLM的说法比以往周期更响亮,但它们有一个关键的区别:早期的工具确实提高了效率。然而,LLM通常会*降低*可靠性和速度。编程的核心挑战不仅仅是将想法转化为代码,而是将模糊的人类思维转化为精确的计算逻辑——这是LLM无法复制的技能。 真正的编程需要理解、推理和学习,需要达到通用人工智能(AGI)尚未实现的人工智能水平。LLM生成的是统计上合理的代码,而不是*被理解*的代码。目前招聘的下降可能归因于经济因素,而不是人工智能的取代。未来很可能出现适度的AI辅助原型设计和代码补全,但熟练的开发人员仍然必不可少——并且可能比以往任何时候都更受欢迎。

启用 JavaScript 和 Cookie 以继续。

## Google Ads 的衰落与网络的变化 最近一篇 Hacker News 的讨论,源于一篇博客文章 (circusscientist.com),集中讨论了 Google Ads 效果的下降,尤其对小型企业而言。作者哀叹 AdWords 作为可靠营销渠道的失去,引发了关于现在应该转向何处的争论。 许多评论者同意,Google Ads 虽然曾经是一个简单的系统,但现在已变得不可信,并且可能充斥着机器人流量。人工智能驱动的信息访问方式的兴起,例如 ChatGPT,被视为主要的颠覆因素。企业现在正专注于内容营销和 SEO,以出现在这些人工智能平台提供的建议答案中,而一些企业则积极阻止人工智能爬虫以保护其内容。 一种普遍的观点是,开放的网络正在“消亡”,取而代之的是像 TikTok 这样的算法驱动平台,在这些平台上获得自然触达越来越困难。一些人预测,广告最终将污染人工智能的结果,类似于目前在亚马逊等平台上的问题。最终,这场对话凸显了人们发现信息方式的转变以及对在线营销未来的担忧。

你需要启用 JavaScript 才能运行此应用。

威利·尼尔森的巡演生活建立在坚定的一致性和深厚的家庭感之上。几十年来,他一直在重现一个熟悉的“客厅”舞台布景——直到酒红色地毯和一丝不苟复制的旅游巴士——为他和他的乐队提供了一个常数。这个“家庭”不仅仅是一个音乐团体,它是一个拥有数十年联系的集体,包括原始成员的兄弟姐妹和子女。 尼尔森的团队和管理层同样重要,许多人已经为他服务了40多年,依靠信任而不是合同运作。这种忠诚延伸到乐队阵容的灵活处理方式,欢迎音乐家的加入和离开,而不会破坏核心。 像他的姐姐鲍比这样的重要成员的逝世,微妙地改变了声音,将其简化到核心——“现在更像是口语”。尽管90岁高龄仍有八天内六场演出的繁重日程,尼尔森仍然坚持,这源于他对观众和农场救援等事业的承诺,甚至与罢工工人站在一起,优先考虑他旨在支持的农民。他的世界是一个持久关系和对道路奉献的世界。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 威利·尼尔森眼中的美国 (newyorker.com) 65 分,由 NaOH 1 天前发布 | 隐藏 | 过去的 | 收藏 | 3 条评论 e40 1 天前 | 下一个 [–] https://archive.is/tLWScdoodlebugging 1 天前 | 上一个 [–] 感谢分享这篇文章和存档链接。我从 1970 年代初开始就是威利·尼尔森的粉丝,并对 7 月 4 日的音乐会怀有美好的回忆。我仍然保留着 1979 年音乐节的 T 恤,就像老 Trigger 一样,它也有一些孔洞和痕迹,表明它已经存在了很长时间。回复 iancmceachern 1 天前 | 父级 [–] “我不是从这里来的,我也不打算离开” 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 分组SIMD弹性哈希表:新的SOTA 这个C++17哈希表实现通过利用**分组SIMD元数据扫描**,在规模较大的表(>500k元素)中实现了最先进的性能。它在读取密集型工作负载中优于`ankerl::unordered_dense`(一个Robin Hood哈希表),在100万个元素下,读取速度提升高达**1.69倍**。 关键创新解决了SIMD对连续内存访问的需求。传统的二次探测会分散内存访问,阻碍SIMD效率。该实现使用**分组探测**——一次扫描16个连续的槽——模仿了Google的Swiss Tables中的方法。每个槽位的1字节元数据标签可以快速过滤掉不匹配项,然后再进行完整的键比较。 虽然插入速度略慢(相比`ankerl`慢0.72倍),但在读取方面的性能提升使其非常适合读取占主导地位的应用。该表是header-only的,需要SSE2支持(x86-64标准配置),目前提供固定容量,未来暂无计划支持删除功能。它源于一项研究,推翻了关于均匀探测的长期猜想。

这个Hacker News讨论围绕一个新的C++哈希表实现([github.com/cranot](https://github.com/cranot)),它利用分组SIMD元数据扫描来提升性能。 许多评论者指出,所使用的技术——特别是用于更快bucket检查的SIMD——已经被成熟的哈希表库采用,例如Boost.Unordered和Google的SwissTable(Rust的Hashbrown的基础)。 人们对提供的基准测试的真实性表示担忧,并认为该项目专注于静态大小(不允许删除),这限制了它的实际应用。 关于二次探测与线性探测的优劣,存在争论,一些人认为线性探测的局部性优势超过了聚类问题。 一个反复出现的主题是对该项目原创性的怀疑,一位评论员建议代码可能由AI(Claude)生成。 讨论还涉及并发哈希表设计以及在多线程环境中可能出现的性能问题。 最后,一些评论员赞赏该项目专注于效率,而非基于Web的臃肿。

更多

联系我们 contact @ memedata.com