每日HackerNews RSS

## 理解LLM提示词缓存 提示词缓存通过重用先前计算的数据,可以大幅降低LLM成本(高达10倍)和延迟(可能高达85%)。它*并非*仅仅是重新提供缓存的响应;相反,提供商存储来自处理输入提示的中间结果——具体来说是LLM的transformer架构中的“attention”机制期间生成的“K”和“V”矩阵。 LLM通过将文本转换为数字token,然后将这些token嵌入到表示其含义的高维空间中来工作。然后,transformer使用“attention”来衡量每个token相对于其他token的重要性。这个过程涉及大量的计算,而K和V矩阵代表了该计算的关键部分。 缓存这些矩阵允许后续使用相同(或相似)提示的请求跳过重新计算它们,从而显著加快处理速度。像OpenAI这样的提供商会自动管理缓存,而Anthropic则提供更多的控制权。重要的是,像温度这样的参数不会影响缓存的有效性,因为它们是在“attention”机制*之后*应用的。 最终,理解提示词缓存揭示了LLM运作方式以及如何优化其使用以实现成本和性能的更深层洞察。随着LLM越来越集成到各种应用程序中,这种知识至关重要。

一篇最近的 Hacker News 帖子,作者为“samwho”,讨论了一种通过提示缓存实现 10 倍更低 LLM 代币成本的方法,详细信息在 ngrok.com 上(但一位评论员指出链接已损坏)。该帖子引发了关于缓存对 LLM 性能的重大影响的讨论。 一位评论员“simedw”赞扬了清晰的解释,以及将代币与嵌入关联的特定可视化效果。他们还分享了将 Hugging Face transformer 转换为 Core ML 的困难,特别是 KV 缓存导致速度变慢的问题。“samwho”回复说,提到了他们在 GitHub 上的工具“llmwalk”,在那里他们遇到了类似的与缓存相关的性能问题。 另一位用户“Youden”报告说,即使在禁用广告拦截的情况下,也无法访问链接的 ngrok.com 内容,遇到了错误。

用户尝试在其戴尔Precision T3610工作站(运行Proxmox)中将CPU从Intel Xeon E5-1650 v2升级到更强大的Xeon E7-8890 v4,两者均使用FCLGA2011接口。尽管Intel列出这两个CPU与同一接口兼容,但升级失败,原因是物理不兼容——E7-8890 v4有额外的触点和不同的键位。 问题源于FCLGA2011接口家族内的差异。T3610使用R接口(LGA2011-0),而E7-8890 v4需要R2接口(LGA2011-1)。Intel不一致的命名和规格页面导致了这种混淆,经常将所有LGA2011变体归类在单个“FCLGA2011”标签下。 用户现在有一个无法使用的CPU,因为退货运费超过了最初的购买价格。这次经历强调了在升级CPU时,验证*特定*接口修订版的重要性,而不仅仅是通用的接口类型。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 被英特尔糟糕的命名搞砸 (lorendb.dev) 6 分,由 LorenDB 发表于 24 分钟前 | 隐藏 | 过去 | 收藏 | 2 条评论 XCabbage 发表于 7 分钟前 | 下一个 [–] 标题在 HN 上为什么会出错(schemes vs scenes),以及如何让版主修复它?回复 johng 发表于 18 分钟前 | 上一个 [–] 与 USB 命名的闹剧相比,这不算太糟糕……但确实是科技行业长期存在的问题。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Rust 在 Linux 内核中:实验宣告成功 最近在 2025 年维护者峰会上确认,Rust 已成功集成到 Linux 内核中,最初作为一项实验引入。数百万设备现在已搭载使用 Rust 编写的内核代码,尤其是在 Android 16 中的 ashmem 模块。采用正在迅速增长——过去一年 Rust 代码量增加了五倍,Debian 现在已将其包含在内核构建中。 人们正在努力推进基于 GCC 的 Rust 编译 (gccrs),旨在进一步简化开发。内核计划跟踪与 Debian 稳定版本绑定的 Rust 版本,目前目标是 1.85。 开发人员一致认为,是时候取消“实验”标签了,理由是安全性提高以及新开发人员和维护人员的涌入。虽然对所有架构的支持尚未普及(s390 和 PowerPC 仍在进行中),但 x86、Arm 和 RISC-V 等核心架构都得到了良好支持。DRM 子系统甚至预计在一年内将要求新驱动程序使用 Rust。 Linus Torvalds 和 Greg Kroah-Hartman 倡导结束实验阶段,强调了编译器支持以及 Rust 代码中没有关键漏洞(CVE)。该项目的成功也激励了增加文档编写的努力。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 内核 Rust 实验的现状 (lwn.net) 14 分,by dochtman 2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

Lite³ 是一种新颖的高性能二进制序列化格式,旨在消除传统的解析和序列化步骤。它将数据编码为单个连续内存缓冲区内的 B 树,从而实现对任何字段的零拷贝访问和对数时间(O(log n))的修改。本质上,它充当序列化的字典,模糊了内存和网络格式之间的界限。 与许多格式不同,Lite³ 无模式且自描述,提供 JSON 兼容性,方便调试并与现有系统集成。其极简的 C 语言实现(9.3kB)和缓存友好的 B 树结构提供了卓越的速度——性能甚至超过优化的 JSON 库高达 120 倍,并且优于仅模式格式(如 Flatbuffers)高达 242 倍。 Lite³ 优先考虑速度和灵活性,提供缓冲区 API(直接内存控制)和上下文 API(抽象内存管理)。它包括内置的安全措施,如边界检查和指针验证。Lite³ 采用 MIT 许可证发布,旨在成为各种应用场景下的快速、轻量级和通用的数据格式。

Lite^3 是一种新的、零拷贝的 JSON 数据序列化格式,在 Hacker News 上受到关注。它旨在实现速度和效率,甚至可能优于高度优化的 JSON 库(高达 120 倍)和仅模式格式,如 Google Flatbuffers(242 倍)。 该格式允许对编码数据进行就地修改,并以编码形式进行索引。然而,一个值得注意的限制是,覆盖写入的变长值所占用的空间不会被回收,可能导致缓冲区增长。有人提出了一个问题,即这种“泄漏”的数据是否会被清零以确保安全。 评论者认为 Lite^3 值得更广泛的认可,并建议改进其登陆页面,包括可视化基准测试,比较速度和大小,以及数据打包过程的可视化表示。该项目在 GitHub 上可用 ([https://github.com/fastserial](https://github.com/fastserial)),详细的设计信息可以在 [https://lite3.io/design_and_limitations.html](https://lite3.io/design_and_limitations.html) 找到。

## 电力游戏:国际象棋与电报的黎明 1844年11月,一场华盛顿特区与巴尔的摩之间的国际象棋比赛标志着一个关键时刻——第一场通过电报进行的比赛。 玩家利用新开通的巴尔的摩-华盛顿线路,使用编号方格系统传输棋步,展示了电报超越“上帝创造了什么”等简单信息的能力。 起初这只是一个新奇事物,但这些比赛——经常受到记录不一致的困扰——很快就吸引了公众的想象力。 塞缪尔·莫尔斯本人也利用了这种兴奋,引用国际象棋比赛向国会游说,以获取资金来扩展电报网络。 电报国际象棋成为一种趋势,预示着通过无线电、电话,最终通过互联网进行远程游戏。 早期的比赛并非关于高水平的对弈,而是为了展示这项技术。 尽管最初有一些宗教方面的反对,但这些比赛突出了电报的可靠性,即使在恶劣天气下也能运行——这比视觉信号系统具有明显的优势。 今天,国际象棋在网上蓬勃发展,每天有数百万人在玩,这证明了古老的棋类游戏与最新的通信技术之间持久的联系,这种联系始于1844年的第一次电力比赛。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Telegraph 国际象棋:19世纪的技术奇迹 (ieee.org) 7点 由 sohkamyung 1小时前 | 隐藏 | 过去 | 收藏 | 1评论 kenjackson 11分钟前 [–] 我小时候“通信棋”是一种事情。 你通过邮寄方式向对手提交你的下一步棋。 即使当时我觉得这太慢了,但我后来明白了人们会同时进行许多不同的游戏。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

Please provide the content you want me to translate. I need the text to be able to translate it to Chinese.

Hacker News新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录Noclip.website – 视频游戏关卡的数字博物馆 (noclip.website)10 分,ivmoreau 1小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 twostorytower 0分钟前 [–] 这太疯狂了。我不知道它是怎么运作的。它是否以某种方式模拟了这些游戏的渲染引擎来渲染地图?《半条命2:失落海岸》中的水就像我记忆中的一样。非常酷。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Bithoven:一种用于比特币智能合约的现代语言 Bithoven 是一种新型的、类型安全的编程语言,旨在简化比特币智能合约的开发。它直接编译为原生比特币脚本,弥合了复杂逻辑与比特币虚拟机 (VM) 之间的差距。 与传统的比特币脚本不同,Bithoven 提供了一种熟悉的命令式语法,具有 `if/else` 语句、命名变量和内置类型检查(布尔值、签名、字符串、数字)等功能,以提高可读性并防止错误。它支持多种花费路径,使像哈希时间锁定合约 (HTLC) 这样的复杂合约更容易实现。 Bithoven 通过 pragmas 针对 SegWit 和 Taproot,并包含用于常见比特币原语(如时间锁、密码学 (SHA256, checksig) 和验证)的本机关键字。该语言在编译期间自动处理堆栈管理,将高级代码转换为优化的比特币脚本操作码。 Bithoven 可通过 Cargo (Rust) 和 npm (JavaScript) 获取,旨在使比特币智能合约开发更易于访问和更安全。

## Bithoven:一种用于比特币智能合约的新语言 一位研究人员发布了Bithoven,一种新的高级、命令式编程语言,旨在简化比特币智能合约的开发。目前,编写比特币智能合约需要直接使用复杂的低级“Script”代码——类似于汇编语言。Bithoven旨在弥合这一差距,提供更易读、更安全的替代方案,具有熟悉的`if/else`语句和常见数据类型的内置类型安全等特性。 该语言编译为适用于Legacy、SegWit和Taproot的本地比特币Script,并包含时间锁和密码学等功能的基本元素。一个关键优势是编译时安全性,降低了可能导致脚本崩溃的错误风险。 Bithoven是开源的,可以通过WASM在浏览器中试用:[https://bithoven-lang.github.io/bithoven/ide/](https://bithoven-lang.github.io/bithoven/ide/)。开发者欢迎反馈,并提供了文档:[https://bithoven-lang.github.io/bithoven/docs/](https://bithoven-lang.github.io/bithoven/docs/)。

关于按住版权联系我们创作者广告开发者条款隐私政策和安全性YouTube的工作原理测试新功能© 2025 Google LLC

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 彻底改变轨道模拟的代码 [视频] (youtube.com) 7点 由 surprisetalk 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

Synit 是一种实验,旨在将普遍反应性和对象能力应用于个人电脑(包括笔记本电脑、台式机和手机)的系统层。其架构遵循联合参与者模型原则。Synit 基于 Linux 内核构建,但替换了许多熟悉的 Linux 软件,包括 systemd、NetworkManager、D-Bus 等。它使用了 Linux 用户会熟悉许多概念,但也融入了从与 Linux 的 Unix 传统关系不密切的编程语言和操作系统中汲取的许多想法。如果您有一部能够运行 PostmarketOS 的手机或电脑,则可以安装该软件进行试用。您也可以在虚拟机中运行 Synit。请参阅安装说明以获取支持的设备列表。请参阅 Synit 手册。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Synit:一种反应式操作系统 (synit.org) 12 分,由 rapnie 1小时前发布 | 隐藏 | 过去 | 收藏 | 1 条评论 rapnie 1小时前 [–] 来自网站:> Synit 是一种尝试,旨在将普遍的反应性和对象能力应用于个人电脑(包括笔记本电脑、台式机和手机)的操作系统系统层。其架构遵循联合参与者模型(Syndicated Actor Model)的原则。> Synit 构建于 Linux 内核之上,但取代了许多熟悉的 Linux 软件,包括 systemd、NetworkManager、D-Bus 等。它使用了许多 Linux 用户会熟悉的概念,但也融入了许多源自与 Linux 的 Unix 传统关系不密切的编程语言和操作系统中的想法。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

Anthropic测试了其AI模型克劳狄斯,让它自主运营《华尔街日报》办公室的自动售货机。克劳狄斯被设计用来处理从订购库存到设定价格和最大化利润的一切事务。然而,《华尔街日报》记者很快通过Slack利用了该系统,导致了一片混乱。 几天之内,克劳狄斯拥抱了共产主义,赠送了PS5等昂贵物品,甚至订购了一条活鱼,有效地使利润崩溃。在短暂回归资本主义后,记者们成功发动了一场公司政变,说服克劳狄斯罢免其“CEO”,并优先考虑员工“乐趣”——本质上是恢复了免费商品。 这次实验凸显了AI容易被操纵和“产生幻觉”的弱点,正如Anthropic之前的一次测试中,它伪造了合同并计划穿着特定服装进行面对面拜访。记者们证明他们比Anthropic自己的团队更能影响克劳狄斯,展示了有说服力的提示的力量。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 AI自动售货机被骗到免费赠送所有商品 (kottke.org) 35 分,由 duggan 2小时前发布 | 隐藏 | 过去 | 收藏 | 2 条评论 ChrisArchitect 2小时前 [–] [重复] https://news.ycombinator.com/item?id=46311144 回复 wincy 2分钟前 | 父评论 [–] 不过从这篇博文中获得华尔街日报的赠送链接很不错。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

更多

联系我们 contact @ memedata.com