## 三元盆景:高性能、低内存语言模型 PrismML 发布了三元盆景,这是一种新型的 1.58 位语言模型系列(8B、4B 和 1.7B 参数),旨在实现高效性能。在他们之前的 1 位盆景模型的基础上,三元盆景通过利用三元权重(-1、0、+1)在内存使用和准确性之间取得了平衡。 这些模型比标准的 16 位模型内存占用小约 9 倍,同时在 MMLU、GSM8K 和 HumanEval+ 等关键基准测试中*优于*许多同等参数的模型。例如,8B 模型实现了 75.5 的平均基准分数,超越了 1 位盆景 8B,并与更大的模型(如 Qwen3 8B)竞争,尽管其尺寸明显更小。 三元盆景还提供令人印象深刻的吞吐量和能源效率,在 M4 Pro 和 iPhone 17 Pro Max 等平台上,运行速度比 16 位模型快高达 5 倍,并且能耗降低 3-4 倍。这些模型通过 MLX 在 Apple 设备上原生支持,并采用 Apache 2.0 许可证提供。它们代表了性能-尺寸权衡的转变,与 1 位系列相比,在内存略有增加的情况下,提供了一个更强大的模型。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 三元盆景:1.58 比特顶级智能 (prismml.com) 6 分,由 nnx 1 小时前发布 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 wmf 7 分钟前 [–] 他们又一次与未量化的其他模型进行比较。他们可能仍然会赢,但尺寸优势会小得多。回复 考虑申请 YC 2026 年夏季批次!申请截止至 5 月 4 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 语言模型中的“退缩”:所谓的“无审查”模型真的自由吗? 最新研究表明,即使是作为“无审查”销售的语言模型,也表现出一种微妙但普遍的偏见——一种对某些词语和话题的“退缩”。这种退缩不是拒绝回应,而是一种统计上的微调,降低了生成文本中出现“敏感”词语(例如与暴力、政治或侮辱性词语相关的词语)的概率。 研究人员在来自五家实验室的七个预训练模型中测量了这种退缩,包括来自谷歌、阿里巴巴、OpenAI和开源选项的模型。他们发现*所有*模型都表现出这种行为,商业过滤模型比开放数据模型表现出更强的退缩。即使是“拒绝消除”模型——那些被设计用来绕过安全限制的模型——仍然表现出退缩,这表明偏见嵌入在核心预训练数据中,而不仅仅是安全层。 这项研究强调,这不仅仅是关于避免明确的拒绝;而是对语言进行系统性的塑造。这引发了对信息微妙控制以及在大型语言模型背景下“无审查”的真正含义的担忧。该研究提供了一个新的框架来理解和量化这些偏见,为更透明和负责任的AI开发铺平了道路。

一个黑客新闻的讨论围绕着即使是“无审查”的AI模型在表达潜在争议观点方面的局限性。用户正在测试模型是否愿意表达与特定人物(如卡罗琳·利维特)一致的观点,以及对敏感话题的看法。 核心发现是,尽管经过努力进行微调,模型始终会“退缩”——缓和或避免使用带有攻击性的语言。一位用户试图训练模型来复制利维特的陈述,但失败了,这凸显了模型对政治正确回应的持续偏见。 有趣的是,回复表明,模型对批评欧洲的偏见比对批评中国或美国的偏见更强,这表明模型可能经过专门训练,以便更开放地接受对这两个国家的批评。 讨论质疑是否能够实现真正无审查的模型,或者固有的偏见是否总是会存在。

## 数据库性能的零拷贝 本文探讨了在数据库引擎中实现零拷贝数据处理以提高性能,尤其是在数据不适合CPU缓存的高负载情况下。传统的数据库架构涉及在磁盘、操作系统页面缓存、缓冲池和更高级别之间进行多次CPU拷贝——所有这些都是浪费的工作。 第一步是使用**直接IO (O_DIRECT)**绕过操作系统页面缓存,这需要对齐的缓冲区和仔细的处理以避免错误。 这消除了一个关键的拷贝。 接下来,重点转向消除数据库引擎*内部*的拷贝,特别是缓冲池和更高级别之间的拷贝。 核心策略是**借用而非拥有**数据。Rust 的生命周期系统被用来创建缓冲池中固定页面字节的视图(例如 `PageReadGuard`、`HeapPageView`),从而避免冗余拷贝。实现了单独的读取 (`PageReadGuard`) 和写入 (`PageWriteGuard`) 访问路径,以维护数据完整性并利用 Rust 的借用规则。 虽然这种方法引入了生命周期注解的复杂性,并且需要显式的方法实现(由于缺乏像 `Vec` 那样的统一的可变/不可变视图),但它显著减少了数据移动。设计将所有权集中在缓冲池中,所有更高级别都在借用的视图上操作,最终提高性能并减少潜在的错误。

Hacker News新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 Rust 中的零拷贝页面:或者我如何停止担心并爱上生命周期 (redixhumayun.github.io) 7 分,ingve 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 arianvanp 5 分钟前 [–] 提醒一下:我知道现在用 Claude 代码生成 ASCII 艺术很酷,但出于某种原因它会检查输出吗?文章中的任何图表都不正确。它们都有间距问题?回复 考虑申请 YC 2026 年夏季批次!申请截止至 5 月 4 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

向门罗币项目捐款 通过向以下门罗币地址(通用基金)捐款,您将支持门罗币项目。如果您希望向特定提案捐款,请参阅所需资金。 888tNkZrPN6JsEgekjMnABU4TBzc2Dt29EPAvkRxbANsAnjyPbb3iQ1YBRk1UXcdRsiKc9dhwMVgN5S9cQUiyoogDavup3H

## Monero社区与发展更新 最近的Hacker News讨论强调了门罗币的优势和挑战。用户赞扬门罗币强大的社区、对最初隐私愿景的坚持以及技术成就——特别是即将到来的FCMP++升级,旨在增强发送者隐私,可能与ZCash相媲美。由社区众筹系统(CCS)资助的getmonero.org网站重新设计也已上线。 然而,对话也承认门罗币在广泛采用方面面临困难,原因是监管障碍和在中心化交易所上的可用性有限。这影响了它在商家处进行日常交易的使用。尽管如此,在接受门罗币的地方,它通常会成为主要的加密货币支付选项,不包括大额个人交易。一些人认为,像Haveno/RetoSwap这样的去中心化交易所替代方案将成为将法定货币兑换成门罗币的关键。

美国“杰拉尔德·R·福特”号航空母舰在克罗地亚进行了一个月维修后,重新部署到中东,此前该舰于三月份发生火灾。官方将事故归因于洗衣区意外起火,但事件引发了伊朗袭击的猜测,美国官员一再否认了这些说法。 “福特”号加入了“亚伯拉罕·林肯”号打击群,预计“乔治·H·W·布什”号将很快抵达,使美国在该地区的航母总数达到三艘。这种兵力部署与2003年伊拉克入侵时的情况相似,但规模较小。 在返回中东之前,“福特”号在加勒比海执行了任务,包括与毒品贩运和委内瑞拉相关的行动。该航母还面临着有关持续技术问题的报告,包括在长期部署期间发生的管道故障。

对不起。

## Jujutsu 的“巨合并”工作流:摘要 本文介绍了 Jujutsu 中的“巨合并”工作流,这是一种管理复杂开发环境和频繁小 PR 的强大技术。与传统的分支不同,“巨合并”并非关于隔离的工作;它是一个具有*多个*父 commit 的单个 commit——本质上将您所有活跃的工作(错误修复、功能、PR,甚至实验代码)合并到一个地方。 主要好处是什么?您始终在统一的、可编译的代码库上工作,从而最大限度地减少合并冲突和上下文切换的摩擦。使用 `jj absorb`(自动压缩)或 `jj squash --interactive` 将更改集成到现有 commit 中,或使用 `jj rebase` 创建新的 commit。别名,如 `jj stack` 和 `jj stage`,简化了合并整个分支的过程。 巨合并*不*直接推送;而是像往常一样发布各个分支。一个自定义的 `jj restack` 别名有助于使您的巨合并与主分支 (`trunk()`) 保持更新。虽然在视觉上很复杂,但此工作流提供了一种无缝高效的方式来同时管理多个任务,从而实现快速迭代并减少开发开销。

一篇最近在Hacker News上的帖子强调了“Jujutsu”日益普及,它提供了一种替代传统Git工作流程的工具。作者icorbrey分享了一种“巨合并”技术,引发了用户的积极反响。 许多评论者表达了对Jujutsu的兴奋之情,其中一人指出它帮助说服朋友放弃Git。 另一人认为它解决了阻碍他们采用Jujutsu的关键问题。作者承认,这种工作流程是由于对现有解决方案不满以及追求完美的心态而构建的。 总的来说,讨论表明人们对Jujutsu的兴趣日益增加,它可能是一种更高效、更易于使用的版本控制系统,尤其是在复杂的变基和合并场景中。该帖子还包含一个Y Combinator申请的公告。

## 最高法院面临保密危机 近期最高法院机密信息泄露——继《多布斯案》判决泄露之后——正促使首席大法官约翰·罗伯茨采取果断行动。作者乔纳森·图利用棒球类比,敦促罗伯茨“保护本垒”,因为法院正面临日益严重的危机。 除了泄露事件本身,内部礼仪的崩溃也显而易见,大法官们公开批评彼此——以索托马约尔大法官对卡瓦诺大法官的评论以及卡根大法官和布雷耶大法官之间激烈争论的报道为例。最新泄露,发表在《纽约时报》上,揭示了关于“暗箱操作”的内部备忘录,以及对环保署规避法律裁决的担忧。 与《多布斯案》泄露不同,这次泄露似乎纯粹是出于恶意,旨在羞辱法院,而非影响判决。罗伯茨之前的调查,由联邦法警领导,未能取得成果。图利认为,罗伯茨现在必须克服顾虑,并让联邦调查局介入,确保调查的完全透明,以恢复公众信任并维护法院的诚信。法院长期以来的保密文化正在瓦解,需要采取果断行动以防止进一步损害。

## Holos:简化的KVM管理 Holos简化了在单个主机上运行多虚拟机堆栈的操作,使用KVM,提供类似Docker Compose的体验,*无需* libvirt、XML配置或分布式控制平面的复杂性。它将虚拟机视为基本单元,为每个虚拟机提供专用的内核、磁盘叠加(qcow2)和cloud-init种子。 您在`holos.yaml`文件中定义堆栈,指定带有镜像、资源分配(vCPU、内存)、依赖项、端口映射和cloud-init配置以进行自定义的服务(虚拟机)。`holos up`、`down`、`ps`、`start`、`stop`、`console`和`exec`等命令管理堆栈生命周期。 主要功能包括:通过专用内部网络实现自动网络连接、持久化卷、用于管理服务依赖项的健康检查、通过自动生成的密钥进行SSH访问,以及能够直通PCI设备,如GPU。Holos还支持从Dockerfile构建镜像,并与systemd集成以实现跨重启的持久运行。 **重要的是,Holos *不是* Kubernetes。** 它专注于简化单主机KVM的使用,避免了编排和集群的复杂性。

## Holos:一个简化的虚拟机运行时 一个名为 Holos 的新项目旨在通过在 QEMU/KVM 之上直接提供 Compose 风格的 YAML 配置,来简化单主机虚拟机管理。它的创建者将其构建为 libvirt XML 和 Vagrant 的替代方案,专注于易用性和现代功能。 主要特性包括简化的 GPU 直通、通过 SSH 控制虚拟机依赖关系的健康检查、虚拟机之间无需 root 权限即可实现的直接 L2 网络,以及通过 cloud-init 或 Dockerfile 进行配置。 值得注意的是,Holos *不是* Kubernetes 的替代品——它仅设计用于单主机设置,缺乏集群和实时迁移功能。它目前是一个正在真实硬件上测试的原型,开发者正在寻求反馈。用户正在询问它与现有工具(如 virt-manager)的兼容性以及与 Proxmox 的潜在集成。

## ChatGPT 现在提供广告位 OpenAI 现在通过与 StackAdapt 的合作,在 ChatGPT 中销售广告位,基于“提示相关性”。这一消息在 Hacker News 上分享,引发了关于广告在热门 AI 工具中不可避免性以及潜在隐私影响的讨论。 用户质疑 OpenAI 是否在向买家推销广告*之前*就已 확보了广告库存,暗示可能进行了市场测试以评估广告价值。一个关键的争论点是广告是否真的会与用户提示数据分离,一位评论员提出,如果 OpenAI 此前的保证被证明是虚假的,可能会出现证券欺诈。 这场讨论也反映了一种对 OpenAI 发展方向日益幻灭的普遍情绪,一位用户戏称这是对其最初愿景的“快速非意图解体”。

## 霍尔木兹海峡中断引发科威特原油不可抗力 由于美国扣押伊朗货船导致局势紧张加剧,科威特宣布部分石油运输实施不可抗力。 科威特石油公司已通知客户,由于进入波斯湾受阻,可能出现交货延误。 此事件发生在上周海峡短暂重新开放之后,重新开放的条件是美国解除对伊朗石油出口的海上封锁——伊朗将此条件与安全通行挂钩。 伊朗警告说,如果其自身石油出口仍然受限,则无法保证霍尔木兹海峡的安全,并拒绝与美国进行新一轮谈判。 这一局势促使船只改变航线,并推高了油价。人们也日益担心伊朗支持的胡塞武装可能对巴布-曼德海峡构成威胁,从而影响替代出口路线。 一支美国代表团正前往巴基斯坦进行潜在谈判。

## 灵魂玩家:Commodore 64 上的 Transformer 研究人员成功地在经典的 Commodore 64 计算机上实现了一个 2 层、仅解码器的 Transformer——这种架构驱动着像 ChatGPT 这样现代的大型语言模型。这款“灵魂玩家”拥有大约 25,000 个参数,利用真实的 multi-head 注意力机制、softmax 和 RMSNorm,全部用 6502 汇编语言手工编码。 该模型可以容纳在标准软盘上,以大约每 token 60 秒的速度生成文本。一项关键创新是 softmax 函数的归一化修复,这使得在 C64 有限的处理能力范围内能够实现有意义的注意力权重。 用户可以通过输入小写文本与模型交互,并接收到响应,尽管速度很慢,每个 token 都会伴随一个音效。该项目包括用于使用简单的文本语料库训练自定义模型以及构建可运行的磁盘镜像的工具。尽管受到其小尺寸和词汇量的限制,“灵魂玩家”证明了 Transformer 架构即使在严重受限的硬件上也是根本可行的。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Soul Player C64 – 一个在 1 MHz Commodore 64 上运行的真实变压器 (github.com/gizmo64k) 7 分,adunk 1 小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 考虑申请 YC 的 2026 年夏季批次!申请截止至 5 月 4 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

苹果公司周一宣布,自2011年起担任苹果公司首席执行官的蒂姆·库克将卸任。库克是史蒂夫·乔布斯因健康问题辞职后的直接继任者。库克将继续担任该职位,直到今年9月1日,届时硬件工程高级副总裁约翰·特努斯将接任首席执行官。库克随后将过渡到新的职位,担任苹果公司执行董事长。库克在一份声明中表示:“约翰·特努斯拥有工程师的头脑,创新者的灵魂,以及以正直和荣誉领导的能力。他是一位富有远见卓识的人,在苹果公司25多年的贡献已经数不胜数,毫无疑问他是带领苹果走向未来的合适人选。我对他的能力和品格充满信心,并期待与他密切合作完成这次过渡,并在我担任执行董事长的新的职位上工作。” 此事仍在发展中…

``` Hacker News新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 [重复] 蒂姆·库克卸任苹果CEO,约翰·特纳斯接任 (techcrunch.com) 51 分,Vortigaunt 30 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 doener 19 分钟前 [–] 重复:https://news.ycombinator.com/item?id=47840219回复 考虑申请YC 2026年夏季项目!申请截止至5月4日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索: ```

美国司法部据报道正在加强对2016年特朗普-俄罗斯勾结叙事起源的调查。关键人事变动预示着调查重点的转变,长期担任特朗普法律顾问的乔·迪杰诺瓦被任命为司法部长顾问,负责领导佛罗里达州Fort Pierce大陪审团的调查——同一法院的艾琳·卡农法官此前曾对特别检察官杰克·史密斯不利裁决。 与此同时,负责调查前中央情报局局长约翰·布伦南的检察官因据称抵制快速提出指控的压力而被撤职。一位与卡农法官有联系的高级助手也被添加到Fort Pierce团队。这些举动是在特朗普总统表达了他对之前面临的调查“正义”的渴望以及对先前问责努力进展不满意的背景下发生的。 调查范围已超出最初的起诉书(后来因程序问题被驳回),现在包括对布伦南的审查,可能与斯蒂尔档案有关。布伦南的法律团队对调查背后的潜在政治动机越来越担忧,特别是考虑到卡农法官之前的裁决。调查范围可能会扩大到包括从“通俄门”到1月6日事件,甚至审查杰克·史密斯的行为。

## 超越组织架构图:理解工作*真正*的完成方式 项目经常停滞,并非因为缺乏技能或努力,而是因为组织未能识别管理执行的“真实”地图——那些超越正式组织架构图的地图。这些隐藏的地图决定了工作*实际*的流程,并揭示了功能障碍的关键见解。 五个关键地图是:**专业知识**(人们*实际*咨询的对象)、**决策**(拥有实际权力的人,通常与正式批准不同)、**记忆**(流程背后的未明说历史与逻辑——当人们离开时很容易丢失)、**连接**(在团队之间架起桥梁的个人,携带重要的背景信息)以及它们*之间*的相互作用。 当这些地图与组织架构图一致时,一切运行顺利。脱节会产生摩擦、重复错误和误解。识别这些地图需要观察——注意反应、推诿以及谁影响决策——而不仅仅是依赖于职位描述。 对于管理者来说,识别和记录这些非正式结构至关重要。过度依赖少数关键人物将多个地图联系在一起会造成脆弱性。使这些地图可见可以暴露隐藏的优势、劣势,以及关于权力动态和能力的潜在令人不安的事实,但对于可持续的成功至关重要。

对不起。

启用 JavaScript 和 Cookie 以继续。

## F-35 辩论:正确的飞机,错误的战争? 一篇近期文章在黑客新闻上引发了关于 F-35 战斗机的争论,质疑它是否“为错误的战争而建”。文章最初暗示 F-35 不适合现代冲突,而现代冲突更倾向于使用可消耗、大规模生产的系统(如无人机),但最终承认 F-35 在其设计角色中表现良好。 评论员普遍认为 F-35 仍然是一种技术上更先进的飞机,尤其是在突破先进的防空系统方面。然而,许多人强调了数量和成本效益在现代战争中日益重要的地位,以乌克兰空军在遭受重创后仍继续作战以及无人机战争的兴起为例。 一个关键点是 F-35 的高成本和漫长的开发周期,与对快速部署、更便宜的替代品的需求形成对比。一些人认为,该计划的主要目的不仅仅是赢得战争,而是维持技术专长和强大的国防工业基础。最终,讨论的中心在于未来空军力量是否在于将像 F-35 这样的高端平台与更大数量的更便宜、无人系统结合起来。

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

## AI 抵抗与黑客新闻的辩论 最近黑客新闻上出现了一场关于对人工智能日益增长的抵抗的讨论,起因是有人试图用虚假信息“毒化”人工智能模型。一些人认为这是一种徒劳的努力——认为存在充足的干净数据,并且新的互联网结构可以绕过这些策略——而另一些人则强调了人工智能生成内容可能导致的“模型崩溃”的实际问题,以及对模型进行成功攻击的可能性。 这场辩论涉及更广泛的主题:人工智能对劳动力的影响、资本主义的作用,以及对人工智能益处的不同看法。一些人认为人工智能可以从工作中解放出来,而另一些人则认为它会加剧现有的不平等。对数据来源和工作岗位流失的担忧尤为突出。 许多评论者对“毒化”的有效性表示怀疑,并认为人工智能的真正影响在于企业内部未知的应用。还有一种观点认为,许多可见的在线反弹是由注意力经济和对科技公司的普遍不信任所驱动的,而不是对人工智能本身的根本反对。最终,这场讨论揭示了围绕人工智能发展及其社会影响的复杂和分裂的局面。

## 苹果宣布领导层过渡 **加利福尼亚州库比蒂诺 – 2026年4月20日** – 苹果公司宣布了一项计划中的领导层过渡,将于2026年9月1日生效。现任首席执行官蒂姆·库克将成为执行董事长,专注于与政策制定者的沟通,而现任硬件工程高级副总裁约翰·特纳斯将接任首席执行官一职。 这一决定遵循董事会批准的长期继任计划。库克于1998年加入苹果公司,2011年成为首席执行官,领导公司经历了巨大的增长——市值增长超过1000%,收入超过4160亿美元。他倡导了苹果服务、可穿戴设备以及向苹果自研芯片过渡等关键举措。 特纳斯是苹果公司的一位25年资深员工,一直致力于开发所有类别的产品,包括iPad、AirPods以及最近的iPhone和Mac创新。阿瑟·莱文森将过渡为首席独立董事,特纳斯将加入董事会。该公司对特纳斯带领苹果走向未来的能力充满信心,并将在其创新和客户至上的传统基础上继续发展。

## 苹果公司领导层变动:蒂姆·库克卸任 蒂姆·库克将从首席执行官过渡到苹果执行主席,约翰·特纳斯将接任首席执行官。这一消息今天宣布,标志着在库克成功任期后的领导层变动,在此期间,苹果市值增长了1000%以上,收入翻了四倍。 讨论的中心是特纳斯在硬件方面的背景,以及人们希望他能够重振苹果的软件,该软件经常被批评为落后于其硬件创新。一些评论员还猜测苹果的政治参与和其服务业务的未来可能发生的变化。 库克因其财务成功和苹果手表、AirPods等关键产品的发布而受到赞扬,但也有人指出新产品推出速度有所放缓。人们乐观地认为,特纳斯在硬件方面表现出色,可以将类似的创新文化带到软件开发中。这一变动导致苹果股价在收盘后略有下跌。

2013年,美国司法部政策转变为各州层面的大麻合法化铺平了道路,选择不在那些新兴大麻计划的州执行联邦禁令。如今,大约80%的美国人——超过2.55亿人——居住在允许某种形式的大麻合法获取的州,无论是娱乐用途还是医疗用途。 最初,科罗拉多州和华盛顿州于2012年率先行动,随后马萨诸塞州和伊利诺伊州等州扩大了医疗大麻的获取范围。最近,加利福尼亚州、密歇根州、新泽西州和纽约州等大州将娱乐用途合法化,改变了这一格局。 尽管娱乐市场不断兴起,但自2015年以来,已有15个州*增加*或扩大了医疗大麻计划,包括最近的内布拉斯加州和德克萨斯州的扩张,不断增加受合法大麻法律覆盖的美国人数量。这表明了全国范围内大麻自由化的一致且不断增长的趋势。

## 苹果宣布首席执行官过渡 多年猜测后,苹果公司宣布蒂姆·库克将于2026年9月1日卸任首席执行官,转任执行董事长。目前硬件工程高级副总裁约翰·特纳斯将在董事会一致批准后接替库克担任首席执行官。 库克于1998年加入苹果公司,2011年成为首席执行官,他将与特纳斯密切合作,确保平稳过渡。在他的任期内,苹果市值飙升超过1000%,达到4万亿美元,收入翻了四倍。作为执行董事长,库克将专注于与政策制定者沟通。 特纳斯是苹果公司工作25年的资深员工,在开发iPad、AirPods以及最近的iPhone和Mac创新产品中发挥了重要作用。他还倡导硬件设计中的可持续发展努力。阿瑟·莱文森将成为首席独立董事,特纳斯将加入董事会。该消息最初导致股价下跌,但随后大部分已恢复。

## 迫在眉睫的粮食危机与全球经济压力 美国农民正面临严峻危机,并因霍尔木兹海峡局势升级而加剧。他们已经负债累累,成本飙升,70%的美国农民报告说,由于价格大幅上涨,无力负担2024年所需的肥料——这场冲突使价格上涨更加严重。这不可避免地将导致作物产量下降和全球粮食价格上涨。 情况在美国南部尤为严重,但影响到全国各地的农民。除了肥料,联合燃料成本已上涨20-40%,进一步挤压农业企业。包括高盛在内的专家承认,肥料危机正加速发展,可能使数亿人陷入粮食不安全。 更糟糕的是,美国对伊朗港口的封锁,旨在向伊朗施压,引发了报复性威胁,扰乱波斯湾和红海等重要水道的航运。这种升级威胁着全球贸易,并已推高了油价——加利福尼亚州的平均油价接近每加仑6美元,英国正为燃料短缺做准备。由于看不到容易解决的方案,预计经济影响将显著恶化。

Lucebox 是一个专注于通过手动优化软件以适应特定硬件,从而优化大型语言模型 (LLM) 推理的项目,而不是依赖通用框架。他们的目标是使强大的 AI 在本地更易于访问,优先考虑隐私、成本效益和避免厂商锁定。 目前,Lucebox 发布了两个项目:**Megakernel Qwen3.5 0.8B**,适用于 RTX 3090 GPU,性能与苹果最新的芯片相匹配,吞吐量提高 2 倍(1.87 tok/J);以及同样适用于 RTX 3090 的 **DFlash DDtree Qwen3.5 27B**,使用推测解码和定制 CUDA 引擎,速度比自回归解码快高达 5.46 倍(207 tok/s)。 这两个项目都提供了详细的基准测试、说明文档,并以 MIT 许可证在 GitHub 上提供。它们利用了内核融合、推测解码和量化等技术,针对目标硬件进行优化,以最大限度地提高性能。未来的工作包括对 Ryzen AI MAX+ 处理器和异构 CPU/GPU 系统的优化。

## Qwen3.5-27B 在 RTX 3090 上达到 207 tok/s 新的实现方式在 Qwen3.5-27B 语言模型上取得了令人印象深刻的性能,在单个 RTX 3090 GPU 上达到 **每秒 207 个 token**。这是通过使用自定义 C++/ggml 推测解码器和“DFlash”块扩散草案实现的,显著优于标准自回归解码(快 5.46 倍)和现有的 SGLang AWQ 实现(快 2.8 倍)。 速度的关键在于针对 24GB 显卡进行优化,利用 KV 压缩至 Q4_0 和滚动特征缓冲区等技术,从而实现 **128K 上下文处理**。开发者专注于 ggml,避免依赖仅 CUDA 的解决方案,如 vLLM,旨在提高可访问性。 改进包括优化的内核和错误修复,从而提高了性能。未来的工作包括守护进程模式以加快初始响应速度,支持贪婪解码之外的采样方法,以及探索更高的量化级别。该项目是开源的(MIT 许可证),可在 GitHub 上获取,并计划在 Qwen3.6-27B 发布后进行适配。开发者明确表示他们不会添加 Metal/Vulkan 支持,将此留给潜在的分支。

启用 JavaScript 和 Cookie 以继续。

## NASA 与宇航员的脏话 一个黑客新闻的讨论浮出水面,关于NASA训练阿波罗11号宇航员避免使用脏话。最初的投诉来自一位宗教大学校长,他联系了NASA和尼克松总统,抗议阿波罗10号机组人员的咒骂,要求道歉。 随后的评论引发了争论。一些人认为脏话仅仅是粗俗,本身并不具有冒犯性,并且在太空旅行的压力环境下会分散注意力。另一些人则认为,这反映了代表国家的宇航员缺乏纪律,并可能导致社会分裂。 几位评论者分享了他们与脏话相关的个人经历,从在军队中采用脏话到通过宗教有意识地消除脏话。一个反复出现的主题是,人们认为礼貌标准随着时间而变化,而且与其它国家相比,美国文化对脏话特别敏感。一位用户甚至开玩笑地想象尼尔·阿姆斯特朗在月球上的第一句话会更加“精彩”。

Kimi 正在开源 Kimi Vendor Verifier (KVV) 项目,以解决开源 AI 模型生态系统中的一个关键问题:确保在不同平台上的实现一致且*正确*。他们发现基准测试结果的广泛差异并非由于模型缺陷,而是由于部署过程中的参数处理不当和基础设施问题。 KVV 提供六个基准测试——包括参数强制、多模态流水线、长输出生成、工具使用和代理编码的测试——以系统地验证推理准确性。它专注于识别与真实模型缺陷不同的“工程实现偏差”。 Kimi 正在积极与 vLLM 和 SGLang 等社区合作,修复根本原因,并提供预发布模型访问以供供应商验证。一个公共排行榜将跟踪供应商的性能,从而提高透明度和可问责性。目标是通过保证模型在任何地方都能按预期工作,从而建立对开源模型的信任。

## Kimi 的供应商验证工具:摘要 Kimi 发布了一款“供应商验证工具”,旨在确保推理提供商(为用户运行 AI 模型的服务)的准确性。该工具测试提供商是否提供与原始模型能力一致的结果。 Hacker News 上的讨论强调了这种方法的潜力与局限性。虽然被认为是迈向透明化的一步,但评论员指出,该验证工具可能无法防止恶意提供商故意使用更便宜、质量较低的模型,并检测/规避测试。 人们也对验证工具的可扩展性表示担忧,因为它运行时间长达 15 小时,并且需要大量资源。然而,总体情绪是积极的,用户指出提供商在未经用户知情的情况下悄悄降低模型性能(“量化等级”)是很常见的问题,因此标准的验证流程很有价值。其他 AI 实验室也被鼓励开发类似的工具。

## 美伊对峙与国内动荡:摘要 随着美国对伊朗实施的停火期即将结束,缓和局势的谈判仍然停滞不前。美国利用这段时间进行补给,破坏伊朗的金融,并封锁霍尔木兹海峡,严重影响了伊朗每日估计达5亿美元的石油收入,并可能长期损害其油田。伊朗试图绕过封锁的尝试,例如最近扣押“M/V Touska”号,已被迅速挫败。 然而,伊朗内部存在分裂。虽然革命卫队(IRGC)控制着关键资产,但正规军(Artesh)可能准备干预,以对抗革命卫队鲁莽的政策,并可能将国家稳定置于卫队议程之上。 与此同时,国内发展表明,针对所谓选举舞弊的镇压正在进行中。联邦调查局局长卡什·帕特尔声称存在证据,政治犯蒂娜·彼得斯据报道正在被转移以获得证人保护。司法部长布兰奇已聘请约瑟夫·迪杰诺瓦来构建针对那些参与被描述为旨在改变美国的“颜色革命”的阴谋案件。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 使用 x86-64 汇编中的字符串指令编写 string.h 函数 (pmasschelier.github.io) 4 分,由 thaisstein 1 小时前发布 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 考虑申请 YC 2026 夏季批次!申请截止至 5 月 4 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

墨西哥当地媒体《千年报》报道,墨西哥中部、墨西哥城东北约40公里处的特奥蒂瓦坎考古遗址发生“武装袭击”。 细节有限,但初步报告称,袭击者爬上月亮金字塔,向游客开枪。 《千年报》在当地时间15点13分左右在X平台发文称:“确认在特奥蒂瓦坎考古区武装袭击中遇难者为加拿大国籍。” 媒体直播:初步报告没有提供更多关于袭击是否与毒品卡特尔有关的信息。 如果您前往墨西哥旅行,购买K&R保险可能是一个明智的选择。 正在发展中…

## 传统金融关注预测市场 金融巨头查尔斯·施瓦布和Citadel Securities都在探索进入快速增长的预测市场领域,目前该领域由Kalshi和Polymarket等平台主导,后者在三月份的交易量达到236亿美元。然而,该领域面临监管审查,一些州指控其为未经许可的体育博彩,并担心内幕交易问题。 施瓦布首席执行官里克·沃斯特表示,未来可能会推出相关产品,但重点将是与长期财富积累相关的市场——*排除*体育、政治和流行文化博彩,因为赌徒的成功率较低。Citadel Securities也在密切关注相关发展,优先考虑流动性以及潜在的对冲投资风险的应用场景,尤其是在选举等重大事件中。 虽然Citadel目前对体育博彩不感兴趣,但两家公司都认为预测市场可以作为风险管理工具,并可能成为为客户提供新服务的途径。

## 圣徒之行与剔除技术:渲染优化总结 本文源于作者发布《圣徒之行:第三次重制版》的经验,深入探讨了至关重要的渲染优化技术——**剔除**,即通过不渲染玩家无法看到的内容来避免不必要的工作。尽管人工智能和渲染技术不断进步,但基础优化仍然至关重要。 核心原则很简单:不要浪费资源。技术范围从基础的**距离、背面和视锥剔除**(廉价、通用的第一步)到更复杂的方法,如**遮挡剔除**(确定被其他物体遮挡的内容),利用硬件查询、软件解决方案(如Hi-Z)和两步系统以提高准确性。 现代方法利用**GPU驱动的渲染**,采用**网格块/簇剔除**等技术将剔除决策转移到GPU,从而实现更细粒度的控制。像虚幻引擎5的Nanite这样的**虚拟几何体**进一步推动了这一点,动态流式传输并仅渲染必要细节。 即使**光照和阴影剔除**对于复杂场景的性能也至关重要。 最终,有效的剔除是一种分层方法,在正确性和性能之间取得平衡。作者强调分析和调整技术以适应特定游戏的需求,优先考虑保守的正确性以避免明显的视觉错误。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 现代渲染剔除技术 (krupitskas.com) 16 分,来自 krupitskas 1 小时前 | 隐藏 | 过去 | 收藏 | 2 条评论 帮助 igraubezruk 37 分钟前 | 下一个 [–] 很好的阅读材料和可视化效果,感谢您的撰写。回复 yopstoday 37 分钟前 | 上一个 [–] 太棒了!回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 量子计算与密码学:无需升级对称密钥 量子计算的兴起需要对**非对称密码学**(如RSA和ECDSA)进行转变,因为Shor算法暴露了其漏洞。然而,一个常见的误解是量子计算机也会削弱**对称密码学**(如AES和SHA-256),需要更大的密钥尺寸。**这是错误的。** 专家和NIST等标准化机构一致认为,现有的对称算法仍然安全。这种担忧源于对**Grover算法**的误解,Grover算法*确实*为暴力破解攻击提供了加速,但不足以需要增加密钥尺寸。并行化Grover攻击也会显著降低其有效性。 NIST甚至将AES-128指定为后量子安全基准,并明确允许其继续使用。虽然一些合规性规范(如CNSA 2.0)要求对所有操作使用256位密钥,但这并非由量子计算驱动的需求。 重点应放在过渡易受攻击的非对称系统上,而不是不必要地升级稳定的对称密码学。资源最好用于解决量子计算构成的*实际*威胁,而不是追逐推测性的风险。

最近一篇Hacker News上的帖子讨论了一种说法,即量子计算机目前对128位对称加密密钥没有构成威胁。这一讨论引发了对Wi-Fi联盟转向WPA3可能导致电子垃圾的担忧。 具体来说,用户指出WPA3从对称AES转向了ECDH,而ECDH *确实* 容易受到量子攻击,可能导致许多物联网设备过时。但另一位用户澄清说,WPA3仍然使用AES作为底层分组密码,以及扩展功能。 另一个提出的观点质疑了文章的框架,认为在没有明确说明的情况下,将哈希算法与对称密钥归为一类是不妥的。作者回应说,哈希*是*对称密码学原语,密钥大小是相关的,因为像Grover算法这样的算法会以类似于密码密钥的方式影响它们。
联系我们 contact @ memedata.com