每日HackerNews RSS

## 语义消蚀:人工智能中意义的流失 大型语言模型的兴起不仅仅是关于*幻觉*(捏造信息);更微妙的危险是**语义消蚀**——算法对复杂、细微信息的侵蚀。这并非错误,而是模型使用强化学习等技术“提炼”的必然结果。 为了产生统计上可能的输出,人工智能系统性地丢弃罕见、精确的语言——携带独特意义的“高熵”数据,转而采用泛化的措辞。激进的安全性和实用性调整会加剧这种情况,惩罚任何非传统的内容。 这种消蚀分阶段发生:首先,去除富有表现力的语言;然后,简化专业词汇;最后,将复杂的推理归结为可预测的结构。结果是经过打磨但最终空洞的“思想JPEG”,失去了原始的深度和精确性。 衡量词汇多样性可以揭示这种衰退。认识并命名语义消蚀至关重要,因为被动接受这些输出会带来“向中间靠拢的竞赛”,牺牲人类思想的丰富性以换取算法的流畅性。

## AI写作:平庸及其根源 最近的Hacker News讨论集中在为什么AI生成的写作常常感觉平庸、乏味,甚至可能有害。核心观点是,AI倾向于“语义消融”——削弱人类散文独特的“尖锐”和独特性,转而采用平淡、易懂的语言。这通过统计替换发生,优先选择常见的同义词而非精确术语,并将复杂的推理简化为可预测的模式。 许多评论者表示同意,指出“AI声音”日益普遍且令人沮丧,缺乏使写作具有冲击力的“棱角”。虽然有些人认为AI公司可以通过更好的提示来解决这个问题,但另一些人认为这是大型语言模型(LLM)的根本局限性,它们专注于预测*预期*的下一个词元,而不是拥抱不可预测性和个人风格。 讨论还涉及提高艺术写作质量是否是AI实验室的优先事项,考虑到当前的市场需求。一些人将其与抗精神病药物对人类思维的影响相提并论,而另一些人则强调AI在技术领域与创意写作方面的成功。最终,观点倾向于AI更适合创意构思和编辑,而写作的核心“灵魂”则留给人类。

每个球的价格 - 在亚马逊上找到最便宜的高尔夫球 亚马逊上的高尔夫球,按每个球的价格排序。 数据来自亚马逊。价格每天更新两次。 作为亚马逊的合作伙伴,本网站通过符合条件的购买赚取佣金。

## 每球价格:高尔夫球优惠查找器 一位Hacker News用户创建了[priceperball.net](https://priceperball.net),一个受diskprices.com启发的网站,旨在帮助高尔夫球手在亚马逊上找到最优惠的价格。该网站按*每球价格*对高尔夫球进行排序,解决了因丢失球而需要频繁更换的昂贵问题。 该网站使用Python脚本,托管在Cloudflare Pages上,并由Github Actions触发,每天两次抓取亚马逊商品信息。它存储新的ASIN码,以随着时间的推移扩大覆盖范围。创建者承认亚马逊的数据存在不一致性——尤其是在“数量单位”与产品标题描述之间——并且正在积极寻找解决方案,目前依赖手动覆盖。 用户提出了一些建议,例如使用运输重量启发法或利用大型语言模型(LLM)准确确定商品信息中的球的数量。初步反馈证实了该网站的实用性,但也指出了由于亚马逊数据不一致导致当前定价存在不准确之处。创建者欢迎反馈和功能建议。

关于按住版权联系我们创作者广告开发者条款隐私政策和安全性YouTube的工作原理测试新功能© 2026 Google LLC

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 这是一生在监狱里的感受 (2023) [视频] (youtube.com) 11 分,由 NaOH 2 小时前发布 | 隐藏 | 过去的 | 收藏 | 5 条评论 帮助 DivingForGold 20 分钟前 | 下一个 [–] 可惜你不能把它作为“独立”版本在桌面电脑上购买……就像最初设想的那样。回复 hrimfaxi 14 分钟前 | 父评论 | 下一个 [–] 这个评论放错地方了吗?回复 amelius 16 分钟前 | 前一个 [–] 只要有像样的网络连接……回复 ge96 4 分钟前 | 父评论 [–] 我曾想过成为冯·诺依曼探测器,如果我能获取整个互联网和生成模型。回复 obloid 1 分钟前 | 根评论 | 父评论 [–] 这基本上就是《鲍勃宇宙》小说的情节。它们读起来很有趣。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

``` AerisLive0旧金山重置随机高度43,000 英尺20,000 英尺10,000 英尺5,000 英尺2,000 英尺500 英尺0 英尺 ```

一位开发者在Hacker News分享了一个项目,将二维航班跟踪数据转换为三维可视化(edbn.me),引发了讨论。该项目利用OpenSky Network API显示航班航迹,目前由于API使用额度限制,免费使用范围限定在特定地理区域,但开源访问允许用户输入自己的密钥以扩大覆盖范围。 用户称赞了该项目对颜色用于表示高度的美学运用,并建议增加显示航班起飞/降落地点等功能,以及融入真实的3D地形。开发者承认当前存在的平面地图局限性,并计划添加自定义地形图。 另一个类似的项目airloom.html也被提及,但其垂直比例被认为夸大了。原始开发者计划通过提供1:1高度比例选项来解决这个问题,以提高准确性,尽管这可能会牺牲一些视觉效果。这次讨论凸显了在航班跟踪可视化中,平衡视觉呈现与数据准确性的挑战。

## 将资本重新导向国家优先事项 一种令人惊讶的共识正在形成:美国的金融业现在*消耗*实体经济,而不是推动它。来自政治光谱各个方面的专家,包括奥伦·卡斯和迪恩·贝克,都同意这一诊断,但解决方案在很大程度上仍未得到解决——资本应该*去*哪里? 高达6万亿美元的资金存在于美国的公共养老基金中,目前的回报与简单的指数基金相当,同时也在资助对社区有害的做法——住房收购、医院关闭和工作岗位流失。这种“耐心资本”非常适合于电网输送、核电站和住房等长期资产,但却被困在高收费的另类投资中。 问题不是缺乏资本,而是一个优先考虑中介利润而非国家需求的系统失灵。日本和新加坡的“财政互惠”等历史先例,展示了成功地将国内储蓄导向基础设施和发展的模式。 重新配置养老基金需要打破当前的平衡——从高成本的另类投资转向对基础设施债券的直接投资。这并非关于新的支出,而是关于战略性地部署现有资本。为不可避免的下一次养老金救助预先起草立法条件——基础设施投资指令、费用上限和明确的资格标准——至关重要。目标不是从内部进行系统性改革,而是利用危机时刻将资本重新导向建设一个更强大、更可持续的经济。

一个黑客新闻的讨论集中在美国养老基金(如CalPers)难以实现必要的回报。为了提高利润,CalPers已将其投资从公开交易的股票(对石油和武器等行业有道德限制)转向私募股权。 评论员质疑这是否是一种“养老金清洗”,将财务收益置于更广泛的社会问题之上——本质上是最大化回报,而不顾未来养老金领取者将要居住的世界。 还有人争论私募股权本身的价值,一些人认为它没有带来真正的经济效益,应该被禁止,而另一些人则认为它是资本主义的核心组成部分。 此外,还提出了潜在的系统性风险问题,提到了未来可能发生类似于2008年的市场崩盘。

## Quake 3 的“魔术数字”与编码技巧 在 1990 年代,游戏开发者面临着计算能力有限的巨大挑战。《Quake III Arena》(Quake 3)是一款 1999 年发布的开创性多人第一人称射击游戏,它展示了卓越的编码效率来处理复杂的 3D 图形。其中一个特别引人入胜的方面是它计算反平方根的算法——这是一个计算量大的操作,对于确定 3D 空间中的物体方向至关重要。 Quake 3 的程序员没有依赖冗长的计算,而是巧妙地利用牛顿-拉夫逊方法,并使用一个出人意料的有效的“魔术数字”——0x5f3759df。这只需*一次*迭代就能获得高度准确的结果,从而大大减少了处理时间。 这个数字的来源在游戏源代码开源后多年一直是个谜。大量的研究最终指向了 Greg Walsh,但确切的推导过程仍然不清楚。这个故事突显了开发者在硬件限制下的惊人创造力,以及看似微小的优化如何对性能产生重大影响。它提醒人们,在游戏开发中,从有限的资源中榨取每一盎司的性能至关重要。

一篇最近的文章讨论了1990年代游戏《Quake 3》中一段巧妙代码背后的“数学谜团”——“快速反平方根”函数。该函数有效地计算1/sqrt(x),对于逼真的3D图形至关重要。 这段代码并非真正的谜团,但因其看似神奇的“魔术数字”(0x5f3759df)而声名鹊起,该数字使其能够以惊人的准确性工作。该函数本身并非全新,存在于数值文献中,但在互联网广泛普及信息之前,许多程序员并不了解它。 Hacker News上的讨论指出,这篇文章有些耸人听闻,维基百科页面提供了更详细的历史和解释。剩余的微小“谜团”在于该特定常数的原始推导方式以及它为什么好,但并非完全最优。最终,这是一个巧妙编程的迷人例子,也是游戏开发的历史遗物。

## SQLite 中的语义搜索:混合方法 本文详细介绍了在 SQLite 中直接实现语义搜索,无需外部向量数据库。核心思想是利用 SQLite 的 FTS5 文本搜索,以及基于意义的检索,通过 **二进制嵌入** 和 **汉明距离** 实现。 传统的语义搜索使用基于浮点数的嵌入,需要大量的存储空间。该实现将嵌入量化为单个比特,大大减少了存储空间(1024 维占用 128 字节),但牺牲了一些准确性——对于速度和空间而言,这是一个值得的权衡。汉明距离利用位运算高效地测量这些二进制向量之间的相似度,并由现代 CPU 优化。 该解决方案被实现为一个自定义的 SQLite 扩展,添加了一个 `hamming_distance` 函数。在 100 万行数据上的性能测试显示,查询时间约为 35 毫秒(包括排序),不包括排序则为 28 毫秒,即使进行全表扫描,也显示出可行的速度。 最后,**倒数排名融合 (RRF)** 结合了 FTS5 的关键词搜索 (BM25) 和语义搜索的结果,创建了一个强大的 **混合搜索**,能够处理精确和细微的查询。这种方法非常适合于 1000 万行以下的数据集,或者在避免外部依赖比线性扫描的成本更重要的情况下。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 SQLite 中混合搜索的汉明距离 (notnotp.com) 12 分,由 enz 发表于 3 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

我们正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1771338848-qVlrhJYvfFT52oQU6GUegP1bsuuWDg0L 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1771338848-qVlrhJYvfFT52oQU6GUegP1bsuuWDg0L

一个黑客新闻的讨论强调了对人工智能和全球化导致工作岗位流失的日益担忧。虽然“比较优势”表明*某些*人力劳动仍将有价值,但评论员担心这并不能保证足够的工作或工资,可能导致财富集中和工资崩溃。 数据显示,在人工智能影响的领域,早期职业工作者的就业人数正在下降——自2022年以来,年轻软件开发人员的就业人数下降了近20%。然而,一些人将此归因于远程工作和成本套利等因素,公司越来越多地选择更便宜的国际劳动力,而不是昂贵的新毕业生。 对话指出需要采取激进的解决方案,例如改变税收,以应对潜在的大规模失业。一个关键主题是适应人工智能的必要性——拥抱像Claude Code这样的工具,并专注于管理自主代理——对抵制变革的人很少同情。一些人认为,仅仅关注人工智能会忽视更广泛的问题,例如不利的美国经济政策。

受到404 Media播客关于社会身份如何塑造我们对真相的理解的启发,作者经历了一个令人惊讶的顿悟:他们失去了一种作为“计算机程序员”的核心身份认同。这并非技能或热情的丧失——他们仍然积极编程——而是与该身份相关的*社会*联系的消解。 对作者来说,编程一直以来都关乎学习和掌握一个逻辑、基于规则的系统的乐趣,并以此在志同道合者社群中获得归属感。三十多年来,这种身份认同深刻地影响了他们的生活,从在线互动到职业选择和友谊。 作者描述了一种微妙但深刻的转变,意识到这种身份认同并非关于编码行为本身,而是已经褪色的文化和社群层面,这导致了一种潜意识的失落感,并促使他们重新评估自我认知。

## 人工智能时代程序员的身份认同 - Hacker News 讨论总结 一篇近期文章引发了 Hacker News 关于程序员角色变化以及可能随之而来的身份认同丧失的讨论。许多评论者对作者因人工智能日益处理编码任务而产生的担忧感同身受。 一个关键主题是将编程从专注于理解计算的工艺,转变为可能被人工智能削弱的工作。一些人感到解脱,希望人工智能能够解放程序员,摆脱繁琐的任务和“伪创新”——无休止的框架争论和次要的移植工作。另一些人则表达了对失去自身核心身份的担忧,尤其是那些在编程还未受到重视时进入该领域的人。 讨论强调了将自我价值与职业联系起来的危险,以及技术分歧个人化的倾向。许多评论者提倡将编程视为一种*活动*,而不是一种*身份*,并专注于更广泛的目标,例如帮助他人。最终,这次对话探讨了人工智能对一个建立在解决问题和持续学习之上的职业所产生的情感影响。

禁止 您没有权限访问此服务器上的 /~cks/space/blog/unix/ViUndoMyViews。

一个 Hacker News 的讨论集中在 Vim、NeoVim 和 Emacs 等文本编辑器的高级撤销/重做功能上。与具有线性撤销历史记录的传统编辑器不同,这些编辑器使用“撤销树”结构。这允许用户导航回到*任何*先前的状态,即使在进行进一步编辑后——有效地分支并保留过去的版本。 用户强调了 Gundo(适用于 Vim/NeoVim)和 ‘undo-tree-mode’(适用于 Emacs)等插件,它们以可视化的方式呈现这棵树,以便更轻松地导航。虽然有些人建议使用 Git 等版本控制系统来获取全面的历史记录,但另一些人指出编辑器内置的撤销树对于快速、细粒度的修改非常方便,而无需频繁提交的开销。 对话还涉及 Vi/Vim 的历史怪癖,一位评论员表达了对 Vim 持久捐赠请求以及处理大文件时的限制感到沮丧。最终,讨论强调了多级撤销/重做作为一种强大且经常被低估的文本编辑工具的价值。

更多

联系我们 contact @ memedata.com