每日HackerNews RSS

## Pulse 2.0:共享音乐聆听 Pulse 2.0 是一个新平台,提供实时的协同聆听体验。用户可以通过浏览器或系统音频主持直播音频流,允许其他人加入并一起收听,并配有聊天功能,包括7TV表情。无需注册账号 – 加入通过匿名代码即可。 该项目目前提供24/7演示房间,播放NTS Radio、SomaFM,甚至 Dire Straits 的 “Money For Nothing” 循环播放。它使用 LiveKit (WebRTC)、Next.js、Node.js 和 Neon Postgres 构建,音乐识别由 AudD 提供支持。 最近的更新(版本 2.0)包括系统音频流、自动音乐识别与去重,以及在流中查看大厅房间的功能。然而,早期用户报告了一些错误,包括 Windows 上的音频问题、难以主持/重新加入房间,以及麦克风功能问题。开发者正在积极收集反馈并修复问题,目前仅支持桌面使用。

Molly Molly 是一个基于Signal的Android独立分支,具有改进的功能: 完全FOSS,不包含专有blob,与Signal不同。 多设备配对:将多个设备绑定到同一个账户。 Material You 额外主题,跟随您的设备配色方案。 自动锁定:当您离开一段时间后自动锁定。 RAM粉碎:安全地粉碎敏感数据。 torbrowser Tor支持:支持通过Orbot使用SOCKS代理和Tor。 以及更多。 新的更好功能即将推出。 基础设施由Bahnhof赞助。 网站/Logo由jaim3提供。

## 虚假财富陷阱:摘要 尽管报告的财富创下历史新高,但世界正面临着迫在眉睫的金融崩溃——甚至正是因为这种财富。这种悖论源于不断萎缩的“实体”经济(物质商品和服务)与不断增加的货币总量之间的差距扩大。其中很大一部分财富是“虚假的”,意味着它无法转化为实际的物质价值。 政府试图通过货币工具刺激经济,但具有讽刺意味的是,这反而*增加了*这种虚假财富,制造了一种危险的幻觉。这得益于中央银行的干预——例如“美联储救市”,鼓励冒险行为并使资产价值膨胀到任何现实基础之外。 核心问题在于,货币仅仅是对实体经济的“索取权”。随着实体经济由于资源枯竭和能源成本(特别是能源成本上升 - ECoEs)而收缩,这些索取权远远超过了其基础。虽然崩溃会摧毁这些虚高的价值,但不会消除实际资源。 作者预测资产市场将在迅速崩溃之前达到最终峰值,强调了系统极端的交叉抵押。那些能够保值的人最终将有机会以大幅降低的价格获得必要的“效用”,但过渡将是混乱的。

## 黑客新闻讨论摘要:财富、能源与经济担忧 最近黑客新闻上围绕一篇博文展开讨论,该博文认为表面上的经济增长很大程度上是虚假的,源于货币收益与日益减少的能源资源之间的脱节。核心观点是,真正的经济繁荣(以投资回报能量比 – EROI 和材料衡量)并未反映在 GDP 数据中。 许多评论者辩论了文章的核心论点。一些人同意金融工程无法创造实际资源,并指出物理经济基准的重要性。另一些人则质疑能源生产效率必然下降的说法,强调了可再生能源和核能领域的进步。 讨论的很大一部分转向了个人理财,一位用户寻求关于管理 30 万美元资金的建议,同时面临抵押贷款和大学费用。回复建议从为了安心还清抵押贷款,到投资指数基金,甚至考虑比特币。 一个反复出现的主题是 GDP 作为衡量幸福感的真实指标的不足,批评集中在它对不同国家医疗保健等价值评估方式的不同之处。最终,这场对话凸显了对经济稳定的焦虑以及在不确定的未来中寻找有韧性策略的需求。

## Imgur 屏蔽与自建方案 Imgur 最近屏蔽了英国用户的访问,作者对此几乎没有察觉,因为他们已经多年没有积极使用该网站了。然而,损坏的 Imgur 链接现在在互联网上经常被遇到——尤其影响 Minecraft 材质包预览。虽然 VPN 可以解决这个问题,但作者不喜欢性能下降以及在每台设备上配置它的需要。 相反,他们利用现有的自建服务器环境构建了一个网络层面的解决方案:Pi-hole、Traefik 和 NixOS。该系统拦截对 Imgur 的请求,通过连接 VPN 的 Docker 容器(Gluetun & Nginx)路由,并将图像透明地提供给网络上的所有设备。 这涉及 Pi-hole 的 DNS 拦截、Traefik 的路由,以及 Gluetun 建立的 VPN 隧道,Nginx 处理代理。敏感的 VPN 凭据由 Agenix 安全管理。虽然承认这有些“过度”,但该解决方案提供了一个干净、自动化的修复方案,性能影响最小,让作者终于可以查看那些难以找到的 Minecraft 材质包。

## Imgur地理封锁与网络解决方案 - 摘要 这次Hacker News讨论围绕Imgur最近对英国用户的地理封锁,可能源于新的数据保护法律和年龄验证要求。发帖者详细描述了使用WireGuard VPN和Docker设置全网络解决方案,以路由Imgur流量,避免为每个设备配置VPN以及速度影响。 对话迅速扩展到各种方法:基于路由器的VPN分流(OpenWRT, UniFi)、代理配置(Firefox容器,FoxyProxy),甚至在廉价硬件(如树莓派)上运行VPN。许多用户对这种封锁表示沮丧,特别是它对网络上嵌入式图片的影响。 一个关键的收获是希望有一种更自动化、特定于域名的VPN解决方案。 许多评论者强调了维护Imgur等服务的IP地址列表的复杂性以及可能出现的故障。 讨论还涉及对互联网审查的更广泛担忧以及访问内容日益困难的问题。 最后,存在关于archive.org是否也在英国被封锁的争论,报告因提供商和帐户设置而异。

你感到无聊吗?我是说,真的非常无聊?达到“愿意做任何事来打发时间”的程度?你恰好又独自一人,而且没有网络连接吗?你可以玩石头剪刀布的单人游戏!你只需要一个骰子。骰子就是你的对手。用手掷出骰子,并在掷出后立即用手做出你选择的形状,然后查看骰子的结果。1-2代表石头,3-4代表纸,5-6代表剪刀。如果你不喜欢这些数字,可以更改它们。例如,我从小玩石头剪刀布(意大利语是Carta-Sasso-Forbici),对我来说,1-2代表纸,3-4代表石头更容易理解。就这些了。我有没有提到你需要非常无聊才能享受这个游戏?作者:Federico klez Culloca,分类:游戏,标签:游戏,单人游戏,游戏设计,石头剪刀布。Federico klez Culloca的作品采用知识共享署名-相同方式共享4.0国际许可。

## 石头剪刀布单人游戏及受无聊启发的游戏 一篇源自 Hacker News 的讨论,起因是链接到“石头剪刀布单人游戏”(klezlab.it),揭示了人们对因无聊而诞生的游戏的喜爱。用户们分享了他们如何创造自己的单人游戏,通常使用简单的方法,例如在脑海中“掷骰子”——将数字范围分配给石头、剪刀和布——来进行决策。 对话涉及了自我对弈的舒适感,回忆起一位国际象棋大师与自己对弈的轶事,以及这种习惯的潜在弊端。其他人则回忆起游戏中名称的地区差异(“石头剪刀布”与“石头纸布”与“纸剪刀布”),以及类似单人游戏,如蛇梯棋或雅思骰。 最终,该帖子强调了人类发明游戏并在资源有限的情况下寻找娱乐的倾向,以及对那种能够培养创造力的无聊的怀旧渴望。

## Susam Pal 关于计算、数学与更多:Lobsters 访谈摘要 本次访谈的对象是 Susam Pal,一位专注 Lisp 编程和终身学习者,探讨了他多样化的兴趣和对计算的 подхода. Pal 的旅程始于 Logo,进而深入研究 Lisp (目前使用 SBCL) 和 Emacs,这些工具他广泛用于个人项目,例如数学粘贴板 (MathB) 和静态网站生成。虽然他精通其他语言 (Python, Go, Rust, C++),但 Lisp 仍然是他工作的核心。 他强调“为了乐趣而计算”,由探索和分享驱动——这体现在交互式数学黑板 (Muboard) 和极简主义绘图语言等项目中。Pal 优先考虑领域理解而非工具,让问题决定使用的语言。他提倡通过清晰的词汇和小型、专注的函数进行可组合的设计,这与 Unix 哲学和 Forth 的分层方法相呼应。 作为一位终身数学爱好者,Pal 强调了严格证明的乐趣,并分享了有影响力的教科书 (Kreyszig, Apostol, Stewart)。他认为数学和计算之间存在着紧密的联系,从数论基础的密码学到数学思维对代码清晰度和正确性的影响。尽管生活繁忙,他仍然平衡探索与专注,优先学习并通过博客和在线论坛分享他的热情。虽然 MathB 最终因审核负担而关闭,但其存档仍然可用。

## 黑客新闻上的龙虾社区讨论 最近黑客新闻上出现了一场关于龙虾社区(lobste.rs)的讨论,该社区被描述为类似于早期黑客新闻的形态——更注重技术,较少关注商业/文化。用户指出龙虾社区的管理更为严格,尤其是在自我宣传和人工智能相关内容方面,并且更偏好深入、小众的技术讨论。 然而,有人对龙虾社区的管理和社区中可能存在的政治偏见表示担忧,一些人声称进步观点受到偏爱。另一些人则为该网站选择性地管理社区辩护。访问龙虾社区需要邀请,但用户建议加入他们的IRC频道来申请邀请。 一些评论员感叹黑客新闻的焦点随着时间推移发生了变化,认为它变得更加商业化,而对构建和技术细节的关注减少了。虽然龙虾社区提供了一种不同的体验,但有人指出由于机器人从黑客新闻上重新发布内容,导致内容存在重叠。总的来说,这场讨论凸显了对专注技术社区的渴望,并反映了在线技术讨论的演变。

## LLM 反模式:经验教训 在与大型语言模型 (LLM) 合作了 15 个月后,出现了一些适得其反的模式。**首先**,避免冗余上下文;LLM 的“记忆”有限。发送重复的、几乎相同的信息(例如连续的截图)会浪费 token 并降低性能。 **其次**,发挥 LLM 的优势。不要要求它做它*不*擅长的事情——比如直接计数——而是利用它的编码能力来*生成*解决方案。通过代码进行工具调用也被证明比直接提问更可靠。 **第三**,避免用过多的上下文(超过约 128k token)使 LLM 不堪重负。随着模型难以管理信息,准确性会下降,可能会“忘记”关键细节。 **第四**,由于训练数据的限制,LLM 在处理晦涩或最近发明的课题时会遇到困难。预计准确性会降低,并相应地进行补偿。 **最后**,保持积极的监督——不要成为“感觉编码员”。密切监控 LLM 的输出,因为它可能会引入细微的错误或安全漏洞(例如泄露敏感数据),如果无人检查,则可能发生。

## LLM 反模式与经验 (Hacker News 讨论) 一个 Hacker News 讨论强调了使用大型语言模型 (LLM) 的潜力和陷阱。 多位用户分享了经验,表明 LLM 在*理解*和调试复杂代码库方面表现出色——甚至能识别不同实现之间的细微差别——比从头开始*编写*代码更好。 一位用户成功地使用 LLM 分析 parquet 文件设置,从而提高了压缩率。 然而,对话也指出了常见的反模式。 主要结论包括:避免冗余信息,利用 LLM 的优势(例如,根据文本描述生成图像,而不是在图像中生成文本),注意上下文窗口的限制,以及避免超出模型知识范围的请求。 用户强调需要具体性、小任务和精确的上下文。 担心 LLM 会在会话中“忘记”信息,以及如果配置管理不当,生产环境可能存在的风险。 一些人认为 LLM 是高级搜索工具,而另一些人则发现它们在头脑风暴时很有用,尽管它们容易出错。 最终,共识倾向于将 LLM 视为需要仔细指导和验证的工具,而不是神奇的问题解决者。

该项目详细描述了一个完全由继电器驱动的控制器设计,用于构建一种“站立马车”(本质上是悬浮滑板),采用1884年左右的技术——不使用半导体,而是依赖继电器、汞和黄铜。其目标是仅使用同期组件复制现代BLDC悬浮滑板控制器。 该系统采用48V电池为三相BLDC电机供电,转子位置通过霍尔传感器或簧片开关检测。一个六步继电器换向器控制电机方向(前进/后退)。倾斜由汞倾斜开关管理,提供缓和或全力扭矩的倾斜。安全问题通过脚踏断路开关来解决。基于继电器的DC-DC转换器为指示器提供5V。 **至关重要的是,该项目明确*不安全***,涉及高电流和潜在危险材料。 警告建造者自行承担风险,并鼓励他们通过公共存储库贡献改进,该存储库采用MIT/CERN开源硬件许可的组合——戏称为“最宁静的电流修士团执照(1884)”。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 模拟悬浮滑板控制器 (github.com/skrubis) 14 分,由 skrubis 发布 7 小时前 | 隐藏 | 过去的 | 收藏 | 2 条评论 londons_explore 5 小时前 [–] 有时你读一份文档,就知道它是用 LLM 写的,因为它太好了。 编写这种仿 18 世纪英语的描述所付出的努力,会超过该项目的设计者在介绍之外所投入的努力(通常只有一两句话),但 LLM 愿意全力以赴。回复 Lik 1 小时前 | 父评论 [–] 所以,你喜欢这个吗?我喜欢。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## JSON Schema:术语解析 JSON Schema 定义了 JSON 数据的结构和约束。其核心在于,**模式(schema)** 是一个 JSON 文档,描述了有效数据*应该*呈现的样子——指定类型、必需属性和允许的值。然而,模式本身也是 JSON,因此需要**元模式(metaschema)**——定义其他模式结构的模式,本质上是对模式本身进行验证。 为了管理不断演进的功能,JSON Schema 被组织成**方言(dialect)**,代表特定版本(如 Draft 2020-12),每个方言都由唯一的元模式定义。在较后版本中引入的**词汇表(vocabularies)** 通过将关键字分组为功能集合(核心、验证、元数据)进一步模块化模式,从而促进可重用性和可扩展性。 本质上:数据*由*模式验证,模式*由*元模式验证。方言捆绑词汇表,定义允许的关键字。 理解这些术语可以释放强大的数据验证和文档能力。虽然术语可能很复杂,但实际使用通常只需要掌握模式、`$schema` 关键字(指定方言)以及核心关键字,如 `type` 和 `properties`。通过词汇表扩展模式以使用自定义关键字,可以实现特定领域验证,使 JSON Schema 具有惊人的通用性。

## Hacker News 上关于 JSON Schema 的讨论 iankduncan.com 上的一篇文章引发了 Hacker News 上关于 JSON Schema、其复杂性以及与 OpenAPI 关系的讨论。虽然这篇文章被认为是一个不错的概览,但评论者强调了细微之处和持续存在的挑战。 一个主要的争论点是 OpenAPI 与 JSON Schema 的关系——OpenAPI 3.1+ 现在使用实际的 JSON Schema,解决了之前因“扩展子集”而导致混淆的问题。然而,兼容性仍然是一个问题,因为许多项目由于工具限制而停留在较旧的 OpenAPI(和 JSON Schema)版本。 几位用户指出,尽管最初很简单,但 JSON Schema 的复杂性正在增加。人们对编写验证器以及在 OpenAPI 中使用 JSON Schema 进行代码生成时需要规范化的问题表示担忧。另一些人则建议,在真正需要严格性时,XML 提供了更好的选择。 讨论还涉及清晰文档和以用户为中心的方法对于 JSON Schema 的重要性,以及避免重复状态以提高系统可靠性的更广泛原则——以一个利用 DOM 作为单一事实来源的新项目为例。

## ClickHouse 实现语义搜索与生成式 AI 本文档详细介绍了一个使用 ClickHouse、Sentence Transformers 和 OpenAI 的 GPT-3.5-turbo 实现语义搜索和内容摘要的系统。Sentence Transformers 生成表示文本语义含义的嵌入向量,从而实现相似性搜索。使用 `all-MiniLM-L6-v2` 模型创建的这些向量与 Hacker News 帖子一起存储在 ClickHouse 数据库中。 一个 Python 脚本演示了使用用户定义的搜索查询查询 ClickHouse,将其转换为嵌入向量,并使用 `cosineDistance()` 函数找到最相似的帖子。 此外,检索到的内容随后使用 LangChain 和 OpenAI 进行摘要。该系统接受一个主题,通过向量搜索检索相关帖子,并使用 GPT-3.5-turbo Chat API 生成简洁的摘要,展示了生成式 AI 在情感分析或文档理解等任务中的实际应用。摘要步骤需要 OpenAI API 密钥。

## 黑客新闻评论数据集与嵌入模型讨论 一个包含 2800 万条黑客新闻评论的数据集已被创建为向量嵌入,引发了关于最佳嵌入模型的讨论。虽然 all-MiniLM-L6-v2 模型之前是实用的选择,但评论员推荐了更新的模型,如 EmbeddingGemma、bge-base-en-v1.5 和 nomic-embed-text-v1.5,以获得更高的基准测试结果和更大的上下文窗口(高达 2k+ tokens)。Qwen3-Embedding-0.6B 也因其开放权重、多语言能力和 32k 上下文而受到赞扬。 对话涉及 EmbeddingGemma 的许可问题以及在客户端运行模型的可行性(重点介绍了较小的模型,如 Ivysaur 和 mdbr-leaf-ir)。用户还讨论了模型大小、速度和性能之间的权衡,以及如何为特定检索任务对模型进行基准测试。 一个关键问题是,在没有明确用户同意的情况下,将公开发布的 HN 评论用于训练 AI 模型是否合法和合乎道德,并引用了 HN 的服务条款和 GDPR。 几位用户表达了对他们的数据以这种方式使用的担忧,而另一些用户则承认在线评论的固有公开性。 数据集的创建者将其托管在 [https://hn.fiodorov.es](https://hn.fiodorov.es) 并分享了 GitHub 上的源代码。

更多

联系我们 contact @ memedata.com