每日HackerNews RSS

## Holos:简化的KVM管理 Holos简化了在单个主机上运行多虚拟机堆栈的操作,使用KVM,提供类似Docker Compose的体验,*无需* libvirt、XML配置或分布式控制平面的复杂性。它将虚拟机视为基本单元,为每个虚拟机提供专用的内核、磁盘叠加(qcow2)和cloud-init种子。 您在`holos.yaml`文件中定义堆栈,指定带有镜像、资源分配(vCPU、内存)、依赖项、端口映射和cloud-init配置以进行自定义的服务(虚拟机)。`holos up`、`down`、`ps`、`start`、`stop`、`console`和`exec`等命令管理堆栈生命周期。 主要功能包括:通过专用内部网络实现自动网络连接、持久化卷、用于管理服务依赖项的健康检查、通过自动生成的密钥进行SSH访问,以及能够直通PCI设备,如GPU。Holos还支持从Dockerfile构建镜像,并与systemd集成以实现跨重启的持久运行。 **重要的是,Holos *不是* Kubernetes。** 它专注于简化单主机KVM的使用,避免了编排和集群的复杂性。

对不起。

## ChatGPT 现在提供广告位 OpenAI 现在通过与 StackAdapt 的合作,在 ChatGPT 中销售广告位,基于“提示相关性”。这一消息在 Hacker News 上分享,引发了关于广告在热门 AI 工具中不可避免性以及潜在隐私影响的讨论。 用户质疑 OpenAI 是否在向买家推销广告*之前*就已 확보了广告库存,暗示可能进行了市场测试以评估广告价值。一个关键的争论点是广告是否真的会与用户提示数据分离,一位评论员提出,如果 OpenAI 此前的保证被证明是虚假的,可能会出现证券欺诈。 这场讨论也反映了一种对 OpenAI 发展方向日益幻灭的普遍情绪,一位用户戏称这是对其最初愿景的“快速非意图解体”。

## 灵魂玩家:Commodore 64 上的 Transformer 研究人员成功地在经典的 Commodore 64 计算机上实现了一个 2 层、仅解码器的 Transformer——这种架构驱动着像 ChatGPT 这样现代的大型语言模型。这款“灵魂玩家”拥有大约 25,000 个参数,利用真实的 multi-head 注意力机制、softmax 和 RMSNorm,全部用 6502 汇编语言手工编码。 该模型可以容纳在标准软盘上,以大约每 token 60 秒的速度生成文本。一项关键创新是 softmax 函数的归一化修复,这使得在 C64 有限的处理能力范围内能够实现有意义的注意力权重。 用户可以通过输入小写文本与模型交互,并接收到响应,尽管速度很慢,每个 token 都会伴随一个音效。该项目包括用于使用简单的文本语料库训练自定义模型以及构建可运行的磁盘镜像的工具。尽管受到其小尺寸和词汇量的限制,“灵魂玩家”证明了 Transformer 架构即使在严重受限的硬件上也是根本可行的。

## Soul Player C64:在复古硬件上运行AI 一位开发者成功地在1MHz的Commodore 64上实现了一个25,000参数的Transformer模型——一种大型语言模型。虽然远小于现代LLM,如GPT-4,但该项目证明了这种架构*可以*在极其有限的硬件上运行。 然而,输出内容大多没有意义,产生破碎的句子和简单的回复,例如“HELLO!”。评论员指出,在C64的限制下,马尔可夫链生成器可能提供可比的速度,甚至获得更好结果。 该项目引发了关于高效AI潜力的讨论,以及进步是否受到仅仅关注增加计算能力所限制。一些人建议探索诸如减少每权重比特数的实现,或利用复古硬件扩展来提高性能等优化方法。 另一些人将其与早期的AI程序(如ELIZA)相提并论,后者通过更简单、基于规则的系统实现了令人惊讶的吸引力。 你可以在这里与该模型聊天:[https://indiepixel.de/meful/index.html](https://indiepixel.de/meful/index.html)

苹果公司周一宣布,自2011年起担任苹果公司首席执行官的蒂姆·库克将卸任。库克是史蒂夫·乔布斯因健康问题辞职后的直接继任者。库克将继续担任该职位,直到今年9月1日,届时硬件工程高级副总裁约翰·特努斯将接任首席执行官。库克随后将过渡到新的职位,担任苹果公司执行董事长。库克在一份声明中表示:“约翰·特努斯拥有工程师的头脑,创新者的灵魂,以及以正直和荣誉领导的能力。他是一位富有远见卓识的人,在苹果公司25多年的贡献已经数不胜数,毫无疑问他是带领苹果走向未来的合适人选。我对他的能力和品格充满信心,并期待与他密切合作完成这次过渡,并在我担任执行董事长的新的职位上工作。” 此事仍在发展中…

对不起。

## 超越组织架构图:理解工作*真正*的完成方式 项目经常停滞,并非因为缺乏技能或努力,而是因为组织未能识别管理执行的“真实”地图——那些超越正式组织架构图的地图。这些隐藏的地图决定了工作*实际*的流程,并揭示了功能障碍的关键见解。 五个关键地图是:**专业知识**(人们*实际*咨询的对象)、**决策**(拥有实际权力的人,通常与正式批准不同)、**记忆**(流程背后的未明说历史与逻辑——当人们离开时很容易丢失)、**连接**(在团队之间架起桥梁的个人,携带重要的背景信息)以及它们*之间*的相互作用。 当这些地图与组织架构图一致时,一切运行顺利。脱节会产生摩擦、重复错误和误解。识别这些地图需要观察——注意反应、推诿以及谁影响决策——而不仅仅是依赖于职位描述。 对于管理者来说,识别和记录这些非正式结构至关重要。过度依赖少数关键人物将多个地图联系在一起会造成脆弱性。使这些地图可见可以暴露隐藏的优势、劣势,以及关于权力动态和能力的潜在令人不安的事实,但对于可持续的成功至关重要。

对不起。

启用 JavaScript 和 Cookie 以继续。

## F-35 辩论:正确的飞机,错误的战争? 一篇近期文章在黑客新闻上引发了关于 F-35 战斗机的争论,质疑它是否“为错误的战争而建”。文章最初暗示 F-35 不适合现代冲突,而现代冲突更倾向于使用可消耗、大规模生产的系统(如无人机),但最终承认 F-35 在其设计角色中表现良好。 评论员普遍认为 F-35 仍然是一种技术上更先进的飞机,尤其是在突破先进的防空系统方面。然而,许多人强调了数量和成本效益在现代战争中日益重要的地位,以乌克兰空军在遭受重创后仍继续作战以及无人机战争的兴起为例。 一个关键点是 F-35 的高成本和漫长的开发周期,与对快速部署、更便宜的替代品的需求形成对比。一些人认为,该计划的主要目的不仅仅是赢得战争,而是维持技术专长和强大的国防工业基础。最终,讨论的中心在于未来空军力量是否在于将像 F-35 这样的高端平台与更大数量的更便宜、无人系统结合起来。

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

## AI 抵抗与黑客新闻的辩论 最近黑客新闻上出现了一场关于对人工智能日益增长的抵抗的讨论,起因是有人试图用虚假信息“毒化”人工智能模型。一些人认为这是一种徒劳的努力——认为存在充足的干净数据,并且新的互联网结构可以绕过这些策略——而另一些人则强调了人工智能生成内容可能导致的“模型崩溃”的实际问题,以及对模型进行成功攻击的可能性。 这场辩论涉及更广泛的主题:人工智能对劳动力的影响、资本主义的作用,以及对人工智能益处的不同看法。一些人认为人工智能可以从工作中解放出来,而另一些人则认为它会加剧现有的不平等。对数据来源和工作岗位流失的担忧尤为突出。 许多评论者对“毒化”的有效性表示怀疑,并认为人工智能的真正影响在于企业内部未知的应用。还有一种观点认为,许多可见的在线反弹是由注意力经济和对科技公司的普遍不信任所驱动的,而不是对人工智能本身的根本反对。最终,这场讨论揭示了围绕人工智能发展及其社会影响的复杂和分裂的局面。

## 苹果宣布领导层过渡 **加利福尼亚州库比蒂诺 – 2026年4月20日** – 苹果公司宣布了一项计划中的领导层过渡,将于2026年9月1日生效。现任首席执行官蒂姆·库克将成为执行董事长,专注于与政策制定者的沟通,而现任硬件工程高级副总裁约翰·特纳斯将接任首席执行官一职。 这一决定遵循董事会批准的长期继任计划。库克于1998年加入苹果公司,2011年成为首席执行官,领导公司经历了巨大的增长——市值增长超过1000%,收入超过4160亿美元。他倡导了苹果服务、可穿戴设备以及向苹果自研芯片过渡等关键举措。 特纳斯是苹果公司的一位25年资深员工,一直致力于开发所有类别的产品,包括iPad、AirPods以及最近的iPhone和Mac创新。阿瑟·莱文森将过渡为首席独立董事,特纳斯将加入董事会。该公司对特纳斯带领苹果走向未来的能力充满信心,并将在其创新和客户至上的传统基础上继续发展。

## 苹果公司领导层变动:蒂姆·库克卸任 蒂姆·库克将从首席执行官过渡到苹果执行主席,约翰·特纳斯将接任首席执行官。这一消息今天宣布,标志着在库克成功任期后的领导层变动,在此期间,苹果市值增长了1000%以上,收入翻了四倍。 讨论的中心是特纳斯在硬件方面的背景,以及人们希望他能够重振苹果的软件,该软件经常被批评为落后于其硬件创新。一些评论员还猜测苹果的政治参与和其服务业务的未来可能发生的变化。 库克因其财务成功和苹果手表、AirPods等关键产品的发布而受到赞扬,但也有人指出新产品推出速度有所放缓。人们乐观地认为,特纳斯在硬件方面表现出色,可以将类似的创新文化带到软件开发中。这一变动导致苹果股价在收盘后略有下跌。

Lucebox 是一个专注于通过手动优化软件以适应特定硬件,从而优化大型语言模型 (LLM) 推理的项目,而不是依赖通用框架。他们的目标是使强大的 AI 在本地更易于访问,优先考虑隐私、成本效益和避免厂商锁定。 目前,Lucebox 发布了两个项目:**Megakernel Qwen3.5 0.8B**,适用于 RTX 3090 GPU,性能与苹果最新的芯片相匹配,吞吐量提高 2 倍(1.87 tok/J);以及同样适用于 RTX 3090 的 **DFlash DDtree Qwen3.5 27B**,使用推测解码和定制 CUDA 引擎,速度比自回归解码快高达 5.46 倍(207 tok/s)。 这两个项目都提供了详细的基准测试、说明文档,并以 MIT 许可证在 GitHub 上提供。它们利用了内核融合、推测解码和量化等技术,针对目标硬件进行优化,以最大限度地提高性能。未来的工作包括对 Ryzen AI MAX+ 处理器和异构 CPU/GPU 系统的优化。

## Qwen3.5-27B 在 RTX 3090 上达到 207 tok/s 新的实现方式在 Qwen3.5-27B 语言模型上取得了令人印象深刻的性能,在单个 RTX 3090 GPU 上达到 **每秒 207 个 token**。这是通过使用自定义 C++/ggml 推测解码器和“DFlash”块扩散草案实现的,显著优于标准自回归解码(快 5.46 倍)和现有的 SGLang AWQ 实现(快 2.8 倍)。 速度的关键在于针对 24GB 显卡进行优化,利用 KV 压缩至 Q4_0 和滚动特征缓冲区等技术,从而实现 **128K 上下文处理**。开发者专注于 ggml,避免依赖仅 CUDA 的解决方案,如 vLLM,旨在提高可访问性。 改进包括优化的内核和错误修复,从而提高了性能。未来的工作包括守护进程模式以加快初始响应速度,支持贪婪解码之外的采样方法,以及探索更高的量化级别。该项目是开源的(MIT 许可证),可在 GitHub 上获取,并计划在 Qwen3.6-27B 发布后进行适配。开发者明确表示他们不会添加 Metal/Vulkan 支持,将此留给潜在的分支。

启用 JavaScript 和 Cookie 以继续。

## NASA 与宇航员的脏话 一个黑客新闻的讨论浮出水面,关于NASA训练阿波罗11号宇航员避免使用脏话。最初的投诉来自一位宗教大学校长,他联系了NASA和尼克松总统,抗议阿波罗10号机组人员的咒骂,要求道歉。 随后的评论引发了争论。一些人认为脏话仅仅是粗俗,本身并不具有冒犯性,并且在太空旅行的压力环境下会分散注意力。另一些人则认为,这反映了代表国家的宇航员缺乏纪律,并可能导致社会分裂。 几位评论者分享了他们与脏话相关的个人经历,从在军队中采用脏话到通过宗教有意识地消除脏话。一个反复出现的主题是,人们认为礼貌标准随着时间而变化,而且与其它国家相比,美国文化对脏话特别敏感。一位用户甚至开玩笑地想象尼尔·阿姆斯特朗在月球上的第一句话会更加“精彩”。

更多

联系我们 contact @ memedata.com