## pg_textsearch:PostgreSQL 的现代排序文本搜索 pg_textsearch 是一个生产就绪的 PostgreSQL 扩展 (v1.0.0),它使用 BM25 算法提供快速、可扩展的排序文本搜索。它可以通过简单的 `ORDER BY content <@> '搜索词'` 语法轻松实现。 **主要特性:** * **BM25 排序:** 可配置的 `k1` 和 `b` 参数,用于微调相关性。 * **PostgreSQL 集成:** 与现有的文本搜索配置(英语、法语、德语等)兼容。 * **性能:** 针对 top-k 查询进行了 Block-Max WAND 优化,支持并行索引构建和分区表。 * **兼容性:** 支持 PostgreSQL 17 & 18。 * **安装:** 克隆 GitHub 仓库后,使用 `make install` 进行简单安装。需要在 `postgresql.conf` 中将 `pg_textsearch` 添加到 `shared_preload_libraries`。 **用法:** 使用 `CREATE INDEX ... USING bm25(column) WITH (text_config='...')` 创建 BM25 索引,然后使用 `<@>` 运算符查询。请记住分数是负数(越小越好)。可以通过 `to_bm25query()` 显式指定索引。 **重要注意事项:** 使用 WHERE 子句进行预过滤可以显著提高性能。该扩展利用 memtable 架构并支持段压缩,以优化查询速度。详细文档和调试功能可用于高级用例。

## 最快的Postgres BM25搜索现已开源 Tiger Data工程师TJ Green在两个季度内,几乎*独立*开发了PostgreSQL的高性能BM25全文搜索扩展`pg_textsearch`——这项成就此前估计需要一个专门团队花费6-12个月才能完成。 为了满足AI工作负载对可扩展关键词搜索解决方案的需求,Green利用AI辅助编码工具(Claude Code + Opus)以及他25年的数据库系统经验。由此产生的扩展,以宽松的Postgres许可证发布,**优于**领先的替代方案Parade/Tantivy——根据MS-MARCO基准测试,**规模下查询吞吐量提高了4.7倍**。 `pg_textsearch`现在可在GitHub上获取 ([https://github.com/timescale/pg_textsearch](https://github.com/timescale/pg_textsearch)),并集成到Tiger Data的云服务中,未来可能被更广泛的云厂商采用。该项目突显了AI正在迅速改变软件开发,挑战着传统的技术壁垒观念。

排行榜:五大领先模型。一项商业任务。生产指标。⏳ 数据集加载中… 这可能需要几分钟,具体取决于数据集大小。

## PhAIL:一个真实世界的机器人基准测试 一个新的基准测试PhAIL (phail.ai) 旨在为视觉-语言-行动 (VLA) 模型提供在实际机器人应用中的诚实性能数据:在仓库环境中执行从箱子到箱子的订单拣选。该创建者,一位前谷歌搜索排名工程师,发现机器人领域缺乏可衡量的结果。 PhAIL 使用 Franka FR3 机器人在一个标准化任务上测试了四种模型(OpenPI、GR00T、ACT、SmolVLA)。结果显示,最佳模型的性能为每小时 64 个单位 (UPH),远低于人类远程操作员 (330 UPH),也远远落后于人工拣选 (1,300+ UPH)。 重要的是,所有数据——视频、遥测数据、数据集和训练脚本——都是公开可用的,并且排行榜开放供提交。该项目强调*真实世界*的性能,与通常经过润色的模拟结果形成对比。创建者正在积极寻求提交,包括闭源模型,并计划添加 NVIDIA 的 DreamZero。

## libpo32:PO-32 数据传输与合成库 libpo32 是一个小型、独立的 C99 库,旨在与 Teenage Engineering 的 PO-32 鼓机进行交互。它专注于复制数据传输过程和鼓合成,*不*作为完整的模拟器。 该库处理构建和解析 PO-32 数据包(补丁、模式、状态),将它们编码成与设备声学调制解调器兼容的音频信号,并将接收到的音频解码回数据。重要的是,它还允许本地合成 PO-32 的鼓声,以便预览和测试。 libpo32 专为嵌入式系统设计,仅需要标准的 C99 头文件,并避免使用 libc 或特定于平台的音频 API 等外部依赖项。它有助于构建向 PO-32 发送/接收数据的工具,并包含编码/解码、鼓合成甚至基本模式编辑器的演示。工作流程包括创建数据、将其渲染为音频,然后将其播放到 PO-32 中进行导入。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Teenage Engineering 的 PO-32 声学调制解调器和合成器实现 (github.com/ericlewis) 6 分,由 ericlewis 1 小时前发布 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 larme 0 分钟前 [–] 太棒了。我想知道合成引擎的准确度如何?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## OkCupid 与数据隐私:黑客新闻摘要 一份最新报告显示,OkCupid 将 300 万用户的照片分享给面部识别公司 Clearview AI,引发了对在线隐私的讨论。这一事件加剧了更广泛的担忧:几乎所有在线服务都将利润置于用户隐私之上,并乐于为了经济利益而牺牲数据。 评论员们争论了以隐私为中心的替代方案的可行性,质疑如何验证其可信度,并承认此类服务的市场有限。一个关键点是,大规模社交网络与隐私之间存在内在的紧张关系——扩张不可避免地会与不太注重隐私的个人建立联系。 许多用户强调了其他公司(如 23andme)类似的数据共享行为,强调了一个根植于资本主义文化中的系统性问题,该文化赋予个人数据价值。讨论的解决方案包括提高数据子处理器的透明度,到根本性地改变社会对数据所有权和使用的看法。最终,许多人认为,谨慎的做法——尽量减少在线分享的个人信息——是目前最可行的策略。

《狂野魔法》处于抢先体验阶段。它现在可以游玩,并且在不断发展,现在购买将获得所有后续内容。✨ 更多法术与组合,打破事物的新方式,🌍 新生物群系,更多地点,更多秘密,⚔ 更强大的对手,更聪明、更具挑战性的法师,🌐 多人游戏,与朋友共享世界。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Show HN: 我的开放世界体素游戏,带有魔法系统,可在浏览器中游玩 (kouh.me) 12 分,由 kouhxp 53 分钟前发布 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

(Empty input provided. There is nothing to translate.)

最近的 Hacker News 讨论围绕 GitHub 的历史正常运行时间,详情见一篇链接到数据可视化的帖子 (damrnelson.github.io)。用户正在分析这些数据,有人建议将 y 轴更改为显示小时数,而不是百分比,以提高可读性。 这次对话引发了人们将 GitHub 的正常运行时间与其他主要服务进行比较的兴趣,以确定停机是否是整个行业的普遍问题。一些评论员回忆说,过去“独角兽页面”(错误消息)出现的频率更高,质疑当时的状态页面更新是否不够一致。 值得注意的是,一位用户报告说,在讨论时,PR 合并出现当前问题,并参考了 GitHub 状态页面。 几位用户表示惊讶,甚至有人声称他们自托管的服务比 GitHub 具有更好的正常运行时间。

美国自由记者雪莉·基特尔森,主要报道中东和阿富汗事务,今天在巴格达被绑架。她的文章曾发表在《半岛电视台》、《外交政策》、《英国广播公司新闻》、《政治报》等媒体。CNN国家安全分析师、前奥巴马政府五角大楼高级官员亚历克斯·普利察斯在X平台确认,基特尔森“被绑架,可能被卡泰布·真主党在巴格达劫持”。总部位于中东的Al Sharqiya电视台援引伊拉克内政部称:“绑架美国记者的车辆在安全追捕中翻车,其中一名绑匪被捕。”绑架过程的影像在X平台上流传。 *正在更新中…

最近CNN对菲德尔·卡斯特罗的孙子桑德罗·卡斯特罗的采访,挑战了美国左翼长期以来对古巴共产主义的浪漫化看法。卡斯特罗表示,现在大多数古巴人支持“具有主权的资本主义”,承认该岛经济模式在数十年衰退和最近的基础设施故障(如广泛的电网崩溃)后失败。 他表示他的祖父会尊重不同的意见,并公开承认渴望经济自由。这一消息与一些美国民主社会主义者和左翼非政府组织对共产主义的持续支持相悖,他们最近组织了一次亲共产主义的古巴之旅。 这次采访凸显了某些美国团体所倡导的意识形态与古巴人民务实愿望之间日益增长的脱节,这反映了南美洲共产主义政权普遍失败的趋势。最终,卡斯特罗的孙子表达了对基本生活必需品——食物、电力和互联网——的需求,他暗示这些只能通过资本主义制度来实现。

尽管伊朗最近宣布只允许“友好”船只通过霍尔木兹海峡,但第四艘希腊控制的油轮 *Pola* 已成功通过。*Pola* 载有约100万桶原油运往泰国,曾短暂关闭其追踪系统,但在印度洋重新出现,确认了成功通行。 此前,本月早些时候,Dynacom Tankers Management Ltd. 的三艘其他船只也完成了类似的航行,同样在没有激活追踪的情况下运行。虽然伊朗限制“敌对”国家进入——希腊并未被视为“友好”国家——但泰国等一些亚洲国家已经达成了双边协议以确保通行。 然而,局势依然动荡。一艘科威特油轮最近在迪拜附近被无人机袭击,凸显了波斯湾航运持续面临的高风险。

您的浏览器似乎禁用了 Javascript。请点击此处了解如何启用 Javascript。如果您有任何问题,请通过 [email protected] 与我们联系。

## 伊朗威胁美国科技公司 伊朗宣布计划将目标对准在中东运营的美国科技公司,可能作为对近期冲突的回应。被点名的公司包括思科、苹果、谷歌、微软以及摩根大通和特斯拉等大型企业,甚至包括金融机构。 Hacker News上的讨论集中在实际影响上。虽然直接的制造足迹有限——英特尔和英伟达在以色列有一些存在——但该威胁旨在阻止未来对该地区的投资,并增加冲突对美国的经济成本。 一位评论员还指出“me-south-1”云区域持续存在可靠性问题,可能与当前的不稳定局势有关。一个关键点是,接受军事合同可能会将公司在国际冲突中定义为合法目标。

systemd近期的一项更改,要求年龄证明,引发了开源社区的强烈反弹,一些反应甚至升级到不可接受的程度。该更新要求提供出生日期,引发了对操作系统不必要数据收集的隐私担忧,以及潜在的政治干预。 尽管对这项更改本身的反对是可以理解的,但讨论中充斥着敌意、虚假信息,甚至是对systemd开发者泰勒的威胁。一些人认为操作系统没有合法需要诸如出生日期之类的个人信息,这呼应了人们对微软等公司类似数据请求的担忧。另一些人指出,systemd已经包含可选的个人数据字段,却没有引起类似的抗议。这种情况凸显了功能性、隐私性以及围绕开源开发日益紧张的环境之间的矛盾。

## 火星最大的障碍:生命维持 人类探索火星的关键在于解决复杂的生命维持问题——这是一个出乎意料地不引人注目但至关重要的障碍。虽然轨道加注等令人兴奋的问题存在,但让宇航员在持续多年的任务中生存下来,却带来了巨大的困难。一位宇航员每天需要大量的资源:840克氧气、2.8公斤水、1.8公斤食物,以及卫生用品。为四名宇航员携带1000天的补给品,将需要48吨的消耗品,超过了航天器的质量限制。 因此,回收至关重要。水回收是第一步,从和平号空间站手动收集冷凝水,发展到国际空间站上复杂的系统,回收率达到约90%。尿液处理可再回收87%,但即使如此,剩余的“盐水”和粪便仍然是一个挑战,需要复杂的、通常是冗余的机器,才能将回收率提高到接近98%。 空气复苏、食物供应、废物管理和医疗保健都增加了进一步的复杂性。维持宜居环境需要持续的监测、维修,以及出乎意料的大量运动设备。最终,成功的火星任务不仅需要创新技术,还需要务实地接受收益递减,以及看似平凡的系统至关重要。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 关于长期生命支持的入门 (mceglowski.substack.com) 5 分,来自 zdw 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

Anthropic的Claude Code CLI工具最近再次发生意外源代码泄露,并在网上迅速被复制和分析。泄露的代码揭示了一些有趣的信息,包括反蒸馏技术——旨在阻止竞争对手通过虚假工具注入和推理链摘要,利用Claude Code的API流量训练模型。虽然这些防御并非万无一失(存在规避方法),但泄露暴露了Anthropic的策略。 更令人担忧的是一种“隐蔽”模式,可以防止Claude Code在开源贡献中识别自身身份,引发了关于AI生成代码未公开披露的伦理问题。代码还展示了一个使用正则表达式的挫败感检测系统,以及Anthropic与OpenCode法律斗争中使用的原生客户端证明。 值得注意的是,发现了对“KAIROS”的引用,这是一种未发布的自主代理模式,暗示了未来的产品方向。泄露可能是由Bun运行时的一个bug导致在生产环境中提供源代码映射。最终,泄露的功能标志和战略见解对Anthropic构成的风险大于代码本身。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Claude 代码源泄露:虚假工具、令人沮丧的正则表达式、秘密模式 (alex000kim.com) 30 分 alex000kim 1 小时前 | 隐藏 | 过去 | 收藏 | 3 评论 帮助 pixl97 27 分钟前 | 下一个 [–] > Claude 代码也使用 Axios 进行 HTTP 请求。基于其他新闻,这很有意思。回复 alex000kim 18 分钟前 | 父评论 | 下一个 [–] 哦,对了,我刚看到 https://news.ycombinator.com/item?id=47582220 我会更新帖子添加这个链接。回复 OfirMarom 2 分钟前 | 上一个 [–] 说实话,秘密模式是最令人担忧的部分。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

加拿大航空首席执行官迈克尔·鲁索因其对三月份致命飞机失事的回应而受到强烈批评,将辞职。事故发生后,鲁索发布了一段视频,主要用英语表达慰问,仅提供简短的法语短语。这激起了魁北克的愤怒,特别是由于一名遇难飞行员来自该省,而语言在该地是一个敏感问题。 这一回应被广泛认为是轻蔑和缺乏同情心,导致魁北克国民议会一致呼吁他辞职,并受到总理马克·卡尼的谴责。尽管声称广泛学习过法语,鲁索仍然难以流利地用两种官方语言发表声明,凸显了更深层次的语言能力问题。 面对越来越大的压力和即将到来的议会调查,鲁索的离职已成必然。加拿大航空董事会现在正在寻找替代者时优先考虑双语能力,这表明了语言在这种领导危机中的关键作用。

## 市场修正与潜在反弹 标普500指数自1月份高点下跌了7%,但更深层的问题在于股市广度显著减弱。超过40%的标普500成分公司已经进入熊市(下跌20%以上),尽管该指数的跌幅相对温和,这表明内部普遍受损。这种背离情况不寻常,软件和汽车等行业表现明显落后,而能源和公用事业则保持强势。 尽管近期下跌,历史数据表明存在反弹的可能性。虽然标普500指数已经跌破了200日移动平均线——历史上预示着下跌的信号——但它*仍然在上涨*的事实表明,反弹的可能性更高。超卖的RSI和上升的悲观情绪等指标也偏向乐观。 然而,风险依然存在,特别是关于伊朗冲突和潜在的油价冲击,这可能引发经济衰退。历史上,类似的情况平均在12个月内收益为+14.6%,但经济衰退可能会显著改变这一结果。关键要点是避免恐慌性抛售,因为历史上,强劲的反弹通常伴随着抛售,而耐心最终会得到回报。

启用 JavaScript 和 Cookie 以继续。

对不起。

## 克劳德代码分叉炸弹及 600 美元教训 这讲述了一位开发者二月份使用克劳德代码(CC)——一种新的 AI 编程工具——的混乱经历。起初犹豫不决,他深入研究,构建了自定义“技能”——用于任务管理(/adhd)、上下文窗口优化(/yablind)、日志记录(/memento)和调试(/yadumb)的工具——这得益于注意力缺陷多动症驱动的过度专注。 然而,一个新创建的“SessionStart”钩子无意中生成了指数级的 CC 实例(分叉炸弹)。开发者在不知情的情况下在夜间释放了它,第二天早上发现电脑完全无响应且过热。 绝望地尝试杀死这些进程失败了,迫使他进行了硬重启。 更糟糕的是,失控的 CC 实例产生了 600 美元的 API 费用。幸运的是,CC 本身固有的低效——巨大的内存消耗——在费用变得无法控制*之前*触发了系统锁定。这次经历是一次代价高昂但宝贵的教训,关于代理工作流程、仔细实现钩子的重要性,以及勉强接受“糟糕代码”拯救这一天的现实。该开发者现在计划进一步开发,并暗示对感兴趣的人们会有更多“疯狂的抱怨”。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 不小心用 Claude Code 制造了我的第一个 fork 炸弹 (droppedasbaby.com) 4 点赞 by offbyone42 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## AI 记忆的物理性:摘要 大型语言模型(LLM),如 ChatGPT,并非通过隐喻的方式“记住”对话,而是通过“键-值”(KV)缓存——实际存储在 GPU 内存中的字节数据。该缓存存储从对话中的每个 token 派生的键值对,使模型能够快速响应,而无需重新处理整个历史记录。然而,这种记忆在 GPU 资源方面代价高昂,并且是临时的,会话结束后消失。 过去六年,LLM 架构不断发展,以更有效地管理这种记忆。早期模型(GPT-2)使用完全记忆,独立存储所有内容。较新的模型(Llama 3、DeepSeek V3、Gemma 3)采用共享表示、压缩和选择性注意力等技术来减小缓存的大小,在内存使用和性能之间取得平衡。一些模型(Mamba)甚至完全放弃了 KV 缓存,而选择过滤。 这种演变凸显了一个根本的权衡:完全记忆与高效处理。当前聊天机器人中的“记忆”功能是独立的系统,长时间对话会因信息退化而导致“上下文腐烂”。最终,KV 缓存代表了 AI 短期记忆的物理限制,促使人们探索外部存储,并可能探索能够管理自身记忆的 AI 系统——这是迈向真正适应性数字思维的关键一步。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 从300KB到69KB每个Token:LLM架构如何解决KV缓存问题 (future-shock.ai) 6点 由 future-shock-ai 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Scotty:现代 SSH 任务运行器 Spatie 发布了 Scotty,一个用于直接从终端运行 SSH 任务和部署脚本的新工具。Scotty 作为 Laravel Envoy 的精神续作,提供了更精简的体验,具有实时、详细的输出以及在部署过程中暂停执行的能力。 Scotty 同时支持 Laravel Envoy 的 Blade 格式*和*一种新的、更简单的纯 Bash 格式——为所有偏好的用户提供灵活性。任务在 `.sh` 文件中使用带有 `# @task` 注释的 Bash 函数定义,使其易于阅读和编辑,并具有完整的 Shell 支持。 主要功能包括:用于设置验证的 `doctor` 命令,用于模拟运行的 `pretend` 模式,以及通过命令行传递变量的能力。Scotty 还会在完成时提供任务计时摘要,并允许暂停进行部署中检查。 现有的 Laravel Envoy 用户可以无缝使用他们的 `.blade.php` 文件,并按照自己的节奏迁移到 `.sh` 格式。Scotty 现已在 GitHub 上发布,并提供完整文档。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Scotty: 一个漂亮的 SSH 任务运行器 (freek.dev) 8 分,by speckx 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 wackget 13 分钟前 [–] 我知道这是最明显的问题,但是… 为什么不直接使用普通的 Bash 呢?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

人工智能生成代码的激增引发了人们对大量低质量“垃圾代码”入侵软件开发的担忧。虽然有人预测人类编码的终结,并且数据显示代码复杂度及故障率都在上升,但Greptile认为经济激励最终会促使人工智能生成*高质量*代码。 目前,“蛮力”方法——快速生成和迭代——占据主导地位,导致代码库更大、更密集。然而,好的代码以简洁和清晰的设计为特征(如John Ousterhout所概述),从长远来看,维护和扩展成本更低。它需要的上下文更少,修改次数更少,最终,需要的计算资源也更少。 人工智能模型之间的竞争将有利于那些能够帮助开发者*最快*交付可靠功能的模型,这需要干净、易于维护的代码。虽然最初的重点是让人工智能代码*能够运行*,但市场最终会优先考虑效率和成本效益,迫使人工智能将质量置于数量之上。这种转变至关重要,因为软件复杂度持续上升,更简单的代码将是可持续发展的必要条件。

## 黑客新闻讨论:好的代码还会胜出吗? 一篇黑客新闻讨论,源于一个链接 (greptile.com),围绕着写得好的代码最终是否会胜出的问题展开。最初的帖子认为会,但评论者很快争论了“好”的定义——它是健壮的,还是仅仅*有用*且具有成本效益? 许多人认为,工程学通常优先考虑功能和可负担性,而不是寿命,并举例说明桥梁被建造得“勉强”能承受压力。 还有人指出罗马混凝土的历史例子,证明建造耐久品*是*可能的,但可能会以牺牲分配给其他需求的资源为代价。 对话还涉及了人工智能的影响。 一些人认为人工智能将使小型参与者能够竞争,而另一些人则认为它不会改变现有模式,即优先考虑上市速度而不是代码质量。 几位评论员挑战了先发优势总是获胜的观点,并举例说明谷歌超越了雅虎。 最后,关于随着越来越强大的人工智能模型,软件开发的未来出现了一场辩论。

这似乎不是可以翻译的文本。它看起来像一个PDF文件的内部数据流,包含二进制代码和乱码,而不是人类可读的语言。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 保护椭圆曲线加密货币免受量子漏洞影响 [pdf] (quantumai.google) 9点 由 jandrewrogers 1小时前 | 隐藏 | 过去 | 收藏 | 2评论 帮助 meling 29分钟前 [–] 当他们用真正的量子计算机破解ECC时再叫我。回复 nh23423fefe 4分钟前 | 父评论 [–] 你的用例有什么有趣之处?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 我三年Lime单车数据:使用Claude的深度分析 三年间,Lime单车一直是我在伦敦的主要交通工具,累计骑行超过6000公里。出于好奇,想确认自己是否是“重度用户”,我利用GDPR要求Lime提供我的完整数据集,并使用Claude进行了分析。 分析结果显示我属于“钻石”级别,排在前1%的用户——“超翡翠”通勤者!除了确认我的使用情况,Claude还揭示了有趣的信息。它准确地 pinpoint 了我过去和现在的家庭和工作地点,甚至仅根据骑行数据就识别出我搬家和换工作的时间。 此外,Claude 推断出了我常去的地点:健身房、最喜欢的早午餐店、牙医诊所和莎莎舞班——所有这些都没有任何额外信息。我甚至可视化了一张“第三空间”地图,展示了我经常的路线和感兴趣的点。 这个实验展示了将数据隐私权与人工智能相结合的力量。欧盟/英国的任何人都可以从Uber、Revolut甚至约会应用程序等应用程序请求数据,并使用Claude等工具来发现隐藏的模式并获得令人惊讶的自我认知。个人发现的潜力是巨大的。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Lime (自行车) 是一家数据公司 (ktoya.me) 14 分,ktoyame 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 2 条评论 帮助 zipy124 发表于 17 分钟前 [–] 花 3000 英镑租自行车对我来说简直是天方夜谭。回复 RandallBrown 发表于 13 分钟前 | 父评论 [–] 这笔钱可以买一辆非常不错的电动自行车或滑板车,用于大多数骑行。但使用 Lime,你就不必担心盗窃、维护或存储问题,这对于很多人来说可能更有价值。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## forkrun:高性能并行器 forkrun 是 GNU Parallel 和 xargs -P 的即插替代品,旨在大幅加速基于 shell 的数据准备,在现代 CPU 上实现 **50 倍至 400 倍** 的加速,尤其是在 NUMA 架构上。它拥有 **20 万次/秒 以上的批处理分发** 和 **95-99% 的 CPU 利用率**,远高于 GNU Parallel 的约 6% 利用率。 forkrun 性能的关键在于其“原生本地”设计,最大限度地减少跨 socket 的内存流量并利用 NUMA 感知。它采用了一种新颖的管道,包含数据摄取、索引、声明和回收工作四个阶段,所有阶段都针对物理局部性进行了优化,并采用诸如 `splice()` 和无锁环形缓冲区等技术。 安装很简单:下载并 source 一个包含嵌入式自解压 C 扩展的 bash 脚本(无外部依赖)。使用方法与 GNU Parallel 相同 – 简单地将 `parallel` 替换为 `frun`。 forkrun 具有 **自适应调优** 功能,无需用户配置即可自动优化批处理大小。它需要 Bash 4.0+ 和 Linux Kernel 3.17+,并优先进行故障隔离和集群集成方面的持续开发。

## Forkrun:更快的 Shell 并行器 jkool702 发布了 **forkrun**,这是一款新的基于 shell 的并行化引擎,旨在显著优于 GNU Parallel 等工具,尤其是在现代多核 NUMA 硬件上。经过 10 年开发,forkrun 通过采用 NUMA 感知内存放置、SIMD 扫描和无锁批处理声明等先进技术,在典型工作负载上实现了 **50 倍至 400 倍** 的速度提升。 在 i9-7940x 上的基准测试显示,forkrun 分发 **200,000+ 批/秒**,所有核心的 CPU 利用率达到 **95-99%**,而 GNU Parallel 约为 ~500 批/秒,利用率约为 ~6%。 Forkrun 被设计为 `xargs -P` 和 GNU Parallel 的直接替代品,无需安装 – 它以单个 bash 文件形式提供,并嵌入了 C 扩展。它非常适合高频率、低延迟的任务,例如日志处理和数据准备。 您可以在 [GitHub](https://github.com/jkool702/forkrun) 上找到更多信息、基准测试和源代码。安装只需 source bash 文件即可:`. frun.bash`。

最近的事件,特别是伊朗对数据中心和军事基地的袭击,凸显了美国反无人机防御中的关键漏洞——这一差距此前已被安全专家指出。由于报告称有无人机出现以及对国土攻击的担忧,美国战争部现在正在考虑在华盛顿特区麦克奈尔堡附近部署反无人机激光武器。 此举标志着转向使用激光等低成本解决方案来对抗日益增长的廉价、甚至可能成群结队的无人机威胁。虽然最近发生在麦克奈尔堡附近的一起事件并未构成威胁,但反无人机活动有所增加。联邦航空管理局正在与战争部合作,以平衡空域安全和国家安全。 担忧不仅限于军事设施,数据中心、基础设施和其他关键地点也面临风险。使用昂贵的导弹拦截器对抗廉价无人机是不可持续的,这使得激光技术成为未来防御战略中潜在的重要组成部分。美国军方最近在埃尔帕索测试了激光武器,但目标是虚假警报(派对气球)。

甲骨文最近的500亿美元融资努力——旨在平息市场担忧并为英伟达和OpenAI等主要客户提供人工智能基础设施——似乎正在失败。尽管报告显示有巨额积压订单(超过4550亿美元,包括与OpenAI的大型交易),但甲骨文的股价暴跌,并且关键的是,其信用违约互换(CDS)达到创纪录高位,甚至超过了2008年金融危机期间的水平。 市场仍然不相信甲骨文能够管理其不断膨胀的2000亿美元债务以及支持其增长所需的巨额资本支出(巴克莱银行估计为2750亿美元,远超普遍预期)。因此,甲骨文正在采取严厉的成本削减措施,启动裁员,预计将影响2万至3万名员工——这一举动已被巴克莱银行预测。 这些裁员旨在产生现金流,为人工智能工作负载所需的基础设施建设提供资金。最近的管理层变动和持续的市场怀疑表明,甲骨文在应对当前环境方面面临重大挑战,并且可能是人工智能投资热潮中出现问题的早期迹象。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Project Mario:DeepMind 的内幕故事 (colossus.com) 5 分,来自 highfrequency 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

Dot 是一款注重隐私的个人 AI 助手,适用于 iPhone,直接在您的设备上运行,无需云服务或帐户。它通过学习您的使用习惯,利用 Apple Shortcuts 在您现有的应用程序中自动化任务——甚至可以根据需求创建新的快捷指令。 Dot 可以管理智能家居设备、处理提醒和日历、发送消息/电子邮件、播放音乐和创建笔记,所有操作均可免提进行。其关键特性是适应性;只需*询问* Dot 执行新的操作,它就会尝试为您构建自定义技能。 Dot 优先考虑用户控制,提供 AI 提供商的选择(Claude、Kimi 或 Apple 的设备端模型,包括离线选项)和完全透明度。它通过包含标准自动续订条款的付费订阅提供。您的数据始终安全且私密,仅存储在您的 iPhone 上。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Dot – 一个 Siri 替代品,通过 Apple Shortcuts (苹果捷径) 学习技能 (apps.apple.com) 8 分,forestplasencia 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 cr3ative 发表于 2 分钟前 [–] 条款:https://www.emotioncomputer.com/terms-of-use 以及隐私政策:https://www.emotioncomputer.com/privacy-policy 都是字面占位符。他们没有填写最低限度信息来使这些内容有用: “这些条款应受 __________ 法律管辖并据此定义。” 我对那些没有把这些基本事项做对的发布非常谨慎。这是我首先查看的地方,以判断是否应该信任一个新的组织。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## hyprmoncfg:Hyprland 的基于终端的监视器配置工具 在 Hyprland 中配置多监视器设置,传统上是一个令人沮丧且迭代的过程,需要编辑配置文件而没有即时视觉反馈。现有的工具提供部分解决方案——没有守护进程的空间编辑器,或具有有限布局控制的守护进程——通常带有大量的依赖项。**hyprmoncfg** 旨在通过轻量级、强大且可靠的解决方案来解决这个问题。 该工具提供了一个**基于终端的 (TUI) 空间编辑器**,允许用户将监视器以矩形的形式可视化排列,并通过键盘快捷键进行对齐和精确控制。它包括一个监视器检查器,用于调整分辨率、缩放和刷新率,以及一个工作区规划器,具有顺序、交错和手动分配策略。 至关重要的是,**hyprmoncfg** 具有**安全的应用系统**和自动回滚功能,可防止配置损坏。它还会**验证 Hyprland 的配置加载**,以避免静默失败。配置文件存储为 JSON 格式,可以与 chezmoi 等点文件管理器无缝集成,从而实现跨机器的可移植性。 **hyprmoncfg** 仅包含两个 Go 二进制文件和一个 Hyprland 依赖项,避免了 Python、GTK 和 D-Bus 的臃肿,甚至可以通过 SSH 进行远程故障排除。它旨在提供可靠性和便利性,提供 Monique 的功能集,而无需依赖项开销。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Show HN: Hyprmoncfg – Hyprland 的基于终端的显示器配置管理器 (paolino.me) 6 分,earcar 发表于 57 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 dSebastien 发表于 0 分钟前 [–] 很棒。这之前一直缺失。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Cohere 发布开源语音识别模型 Transcribe Cohere 发布了 Transcribe,一种全新的、最先进的开源自动语音识别 (ASR) 模型,专为实际的、现实世界的应用而设计。Transcribe 从头开始训练,专注于最小化词错误率 (WER),旨在不仅仅是一个研究项目——它具有可管理的足迹和高效的服务能力,专为生产环境构建。 目前,Transcribe 在 HuggingFace 的 Open ASR 榜单中排名第一,WER 达到 5.42%——优于 Whisper Large v3 和 ElevenLabs Scribe v2 等模型。它支持欧洲、亚太地区和中东北非地区的 14 种语言,并采用 Apache 2.0 许可。 除了准确性之外,Transcribe 还提供一流的吞吐量,这对于实时应用至关重要。它可在 Hugging Face 上下载,通过 Cohere 的 API(有速率限制)或通过 Model Vault 的完全托管、可扩展部署获得。Cohere 计划将 Transcribe 与其 AI 代理平台 North 集成,将其能力扩展到更广泛的语音智能解决方案。

Cohere 发布了新的语音识别模型“Transcribe”,采用 Apache 2.0 许可,在 Hacker News 上获得了积极关注。用户尤其对开源许可表示满意,这与 Cohere 其他一些模型的非商业限制形成对比。 一位评论员强调了 Cohere 在嵌入模型方面始终表现出色,并赞扬了其可靠的速度。然而,一个主要担忧是,专门的自动语音识别 (ASR) 技术是否会过时。 观点是,越来越强大的多模态人工智能系统——例如在光学字符识别 (OCR) 方面表现出色的系统——可能会利用其广泛的理解来准确解释语音,即使存在缺陷,从而有效地使专门的 ASR 工具变得不必要。 这是因为上下文理解可以弥补纯语音转文本的不足之处。

美国财政部正在严厉打击医疗保险、医疗补助和其他健康福利计划中日益猖獗的欺诈行为,估计涉及数十亿美元的资金流失。最近的一份公告详细说明了复杂的骗局,包括跨国犯罪组织、虚假提供者、身份盗窃和洗钱。 为了应对这种情况,财政部的金融犯罪执法网络(FinCEN)正在实施举报人计划,对成功追回的欺诈、洗钱和违反制裁案件的罚款提供10-30%的奖励。一个新的举报门户网站现已开放。 这项倡议由特朗普政府倡导,是在报告的医疗欺诈相关可疑活动增加20%之后推出的。官员们认为这仅仅是“冰山一角”。贝森特部长强调了政府保护纳税人资金的承诺,并鼓励知情人士举报欺诈行为。该努力与一项旨在打击联邦支出浪费和滥用的更广泛的行政命令相符,调查已经在进行中,尤其是在纽约州等地的医疗补助计划方面。

联系我们 contact @ memedata.com