每日HackerNews RSS

Lucebox 是一个专注于通过手动优化软件以适应特定硬件,从而优化大型语言模型 (LLM) 推理的项目,而不是依赖通用框架。他们的目标是使强大的 AI 在本地更易于访问,优先考虑隐私、成本效益和避免厂商锁定。 目前,Lucebox 发布了两个项目:**Megakernel Qwen3.5 0.8B**,适用于 RTX 3090 GPU,性能与苹果最新的芯片相匹配,吞吐量提高 2 倍(1.87 tok/J);以及同样适用于 RTX 3090 的 **DFlash DDtree Qwen3.5 27B**,使用推测解码和定制 CUDA 引擎,速度比自回归解码快高达 5.46 倍(207 tok/s)。 这两个项目都提供了详细的基准测试、说明文档,并以 MIT 许可证在 GitHub 上提供。它们利用了内核融合、推测解码和量化等技术,针对目标硬件进行优化,以最大限度地提高性能。未来的工作包括对 Ryzen AI MAX+ 处理器和异构 CPU/GPU 系统的优化。

对不起。

启用 JavaScript 和 Cookie 以继续。

## NASA 与宇航员的脏话 一个黑客新闻的讨论浮出水面,关于NASA训练阿波罗11号宇航员避免使用脏话。最初的投诉来自一位宗教大学校长,他联系了NASA和尼克松总统,抗议阿波罗10号机组人员的咒骂,要求道歉。 随后的评论引发了争论。一些人认为脏话仅仅是粗俗,本身并不具有冒犯性,并且在太空旅行的压力环境下会分散注意力。另一些人则认为,这反映了代表国家的宇航员缺乏纪律,并可能导致社会分裂。 几位评论者分享了他们与脏话相关的个人经历,从在军队中采用脏话到通过宗教有意识地消除脏话。一个反复出现的主题是,人们认为礼貌标准随着时间而变化,而且与其它国家相比,美国文化对脏话特别敏感。一位用户甚至开玩笑地想象尼尔·阿姆斯特朗在月球上的第一句话会更加“精彩”。

Kimi 正在开源 Kimi Vendor Verifier (KVV) 项目,以解决开源 AI 模型生态系统中的一个关键问题:确保在不同平台上的实现一致且*正确*。他们发现基准测试结果的广泛差异并非由于模型缺陷,而是由于部署过程中的参数处理不当和基础设施问题。 KVV 提供六个基准测试——包括参数强制、多模态流水线、长输出生成、工具使用和代理编码的测试——以系统地验证推理准确性。它专注于识别与真实模型缺陷不同的“工程实现偏差”。 Kimi 正在积极与 vLLM 和 SGLang 等社区合作,修复根本原因,并提供预发布模型访问以供供应商验证。一个公共排行榜将跟踪供应商的性能,从而提高透明度和可问责性。目标是通过保证模型在任何地方都能按预期工作,从而建立对开源模型的信任。

## Kimi 的供应商验证器:确保 LLM 性能 Kimi (kimi.com) 发布了一款“供应商验证器”,用于评估使用其 K2 和 K2.5 模型进行推理的提供商的准确性。此举旨在解决提供商在未经通知的情况下降低性能的问题——无论是通过更新意外发生,还是为了增加利润而故意使用更便宜、质量较低的模型版本(量化)。 该验证器旨在为提供商维护质量制造社会压力,尤其是在诸如对话无故结束和性能不一致等问题会影响代理任务的情况下。虽然不能完全阻止恶意行为者,但它可以检测性能的意外“漂移”(例如依赖项更新导致速度变慢),并提高了故意虚报的风险。 讨论强调了 OpenRouter 等提供商存在的问题,那里常见更便宜、高度量化的模型。一些用户认为该验证器主要是一种品牌保护措施,确保 Kimi 的模型被准确地呈现。另一些人指出,扩大此类全面测试的规模具有挑战性,但建议供应商可以将其用于内部置信度和持续监控。最终,该验证器代表着在快速发展的 LLM 推理领域迈向更大透明度和问责制的一步。

对不起。

## 圣徒之行与剔除技术:渲染优化总结 本文源于作者发布《圣徒之行:第三次重制版》的经验,深入探讨了至关重要的渲染优化技术——**剔除**,即通过不渲染玩家无法看到的内容来避免不必要的工作。尽管人工智能和渲染技术不断进步,但基础优化仍然至关重要。 核心原则很简单:不要浪费资源。技术范围从基础的**距离、背面和视锥剔除**(廉价、通用的第一步)到更复杂的方法,如**遮挡剔除**(确定被其他物体遮挡的内容),利用硬件查询、软件解决方案(如Hi-Z)和两步系统以提高准确性。 现代方法利用**GPU驱动的渲染**,采用**网格块/簇剔除**等技术将剔除决策转移到GPU,从而实现更细粒度的控制。像虚幻引擎5的Nanite这样的**虚拟几何体**进一步推动了这一点,动态流式传输并仅渲染必要细节。 即使**光照和阴影剔除**对于复杂场景的性能也至关重要。 最终,有效的剔除是一种分层方法,在正确性和性能之间取得平衡。作者强调分析和调整技术以适应特定游戏的需求,优先考虑保守的正确性以避免明显的视觉错误。

## 现代渲染剔除技术:总结 这次Hacker News讨论的核心是**剔除**——通过不绘制观察者无法看到的物体来优化渲染,尤其是在现代游戏和元宇宙等复杂动态环境中。 关键点包括处理用户生成内容、透明物体(如窗户)以及大型详细场景时,遮挡剔除的难度。虽然**遮挡剔除**和**Portal剔除**等技术存在,但在这些情况下它们可能计算成本高昂且效果不佳。现代GPU越来越多地利用上一帧的数据和边界框查询来处理动态遮挡剔除。 对话还涉及历史背景,提到了老式游戏中使用的**PVS(潜在可见集)**技术,以及**BSP树**在处理复杂几何体方面的局限性。最后,该讨论探讨了一个哲学问题:如果未被观察到,物体是否被“渲染”,并强调了即使在光线追踪和渲染技术取得进步的情况下,优化仍然是必要的。 许多用户分享了相关资源链接,包括Roblox GDC演讲和一个解释剔除概念的YouTube视频。

## 量子计算与密码学:无需升级对称密钥 量子计算的兴起需要对**非对称密码学**(如RSA和ECDSA)进行转变,因为Shor算法暴露了其漏洞。然而,一个常见的误解是量子计算机也会削弱**对称密码学**(如AES和SHA-256),需要更大的密钥尺寸。**这是错误的。** 专家和NIST等标准化机构一致认为,现有的对称算法仍然安全。这种担忧源于对**Grover算法**的误解,Grover算法*确实*为暴力破解攻击提供了加速,但不足以需要增加密钥尺寸。并行化Grover攻击也会显著降低其有效性。 NIST甚至将AES-128指定为后量子安全基准,并明确允许其继续使用。虽然一些合规性规范(如CNSA 2.0)要求对所有操作使用256位密钥,但这并非由量子计算驱动的需求。 重点应放在过渡易受攻击的非对称系统上,而不是不必要地升级稳定的对称密码学。资源最好用于解决量子计算构成的*实际*威胁,而不是追逐推测性的风险。

## 量子计算机与128位加密:摘要 Filippo Valsorda最近的一篇文章(在Hacker News上讨论)认为,尽管人们担心Grover算法,但量子计算机对AES等128位对称密钥并非直接威胁。虽然Grover算法*可以*减少有效密钥长度,但破解AES-128仍然需要巨大的、目前无法达到的计算资源。 讨论强调,量子攻击的实用性不仅仅在于算法,还在于构建和扩展具有足够量子比特和纠错能力的量子计算机的物理可行性。 虽然有些人推测未来可能的量子突破可能会利用对称密码中Grover算法之外的弱点,但目前的理解表明,它对于无结构搜索是可证明的最优算法。重点正在转向准备应对潜在的、但不确定的未来威胁,促使人们考虑更长的密钥长度(如256位AES)和后量子密码学。 对话还涉及清晰的技术写作的重要性,以及在平衡理论风险与实际实施问题时的必要性,尤其是在广泛的密码学变更成本方面。

启用 JavaScript 和 Cookie 以继续。

## 黑客新闻讨论摘要:安杜里尔、帕兰蒂尔与未来战争 一篇最近的《经济学人》文章(已链接,但需要付费)引发了黑客新闻关于安杜里尔、帕兰蒂尔和SpaceX等公司——被称为“新一代主要承包商”——及其对美国军事战略的影响的讨论。核心观点是,这些公司比传统的国防承包商更有效地提供快速、尖端的技术(尤其是软件)。 对话迅速扩展到对政治和伦理影响的担忧。用户质疑太空探索背后的动机,将其与民族主义和经济利益联系起来。人们对彼得·蒂尔和JD·万斯等人物的影响力表示担忧,一些人指责他们有一个激进的政治议程在驱动决策。帕兰蒂尔受到了特别的批评,有人呼吁解散该公司,并指责其为“技术法西主义”。 一些评论员强调了向1990年代以前的国防模式转变,即快速迭代和竞争。另一些人则对公民自由的侵蚀以及这些技术可能被滥用的可能性表示担忧,特别是关于自主武器和监控。一个反复出现的主题是对领导这些公司的个人及其与潜在有害政策的协调的不信任。

## Hacker News 上关于 Kefir 编译器 的讨论 一位开发者独立开发的 Kefir C17/C23 编译器,托管在 sr.ht 上,正在 Hacker News 上引发讨论。用户称赞了创建完整编译器实现的成就,并强调了其令人印象深刻的测试套件。 然而,评论者表达了希望获得更多关于该项目*动机*和*独特优势*的清晰信息。虽然开发者概述了诸如最大程度地减少编译过程中的“魔法”——提供对代码转换的更大控制和理解之类的目标,但一些人认为这种解释缺乏细节。 核心吸引力似乎在于,对于那些喜欢直接控制代码与硬件交互方式,而不是依赖于成熟编译器中的抽象的程序员来说,一个透明、自我理解的工具链的价值。 讨论还提到了个人动力在软件开发中的力量。

## XORD Systems “唐吉诃德”项目:对抗 Palantir 的监控愿景 XORD Systems 启动了一个项目,旨在揭露并阻止 Palantir Technologies 不断扩张的监控能力可能造成的反乌托邦局面,其在《技术共和国》宣言中对此进行了阐述。该文件提倡增加数据收集和预测性警务,将其定义为捍卫西方价值观的“道德责任”——同时从这些系统中获利。 XORD 认为 Palantir 旨在构建一个私有化的控制系统,利用人工智能、生物识别数据和大规模监控技术。作为回应,XORD 提交了一项“动态公平社会信用评分”系统的临时专利——并非为了将其商业化,而是作为“先期技术炸弹”,以突出此类技术的危险性并引发公众讨论。 该项目借鉴了国家监控的历史先例,从古埃及到东德,并警告说未来个人将被简化为数据点。XORD 的创始人发现了一部先前未发表的小说,其中包含了这个反乌托邦的蓝图,这进一步推动了他们利用官僚系统来揭露迫在眉睫的威胁。最终,XORD 旨在在“食尸鬼阶层”——那些促成这个监控国家的人——中制造“认知失调”,并引发关于自由和隐私未来的更广泛辩论。

## 黑客新闻讨论摘要:Palantir 与有争议的“宣言” 一个批评 Palantir 的网站链接,被描述为“宣言”,在黑客新闻上引发了争论。许多评论者质疑作者的风格和语气,将其比作过于网络化的言论,甚至认为它可能是 AI 生成的,因为其呈现方式不寻常。人们对该作品的可信度表示担忧,一些人指出它在美学上与较早的“匿名者”风格内容相似。 作者,自称是一个团队(“我们”),澄清他们是这个平台的初学者,并承认过度宣传他们自己的工作——包括开源隐私工具和关于 AI 对齐的研究——这导致了频繁的标记。 讨论还集中在 Palantir 本身,一些用户将其描述为与军工复合体联系紧密,并参与大规模监控的公司。一位评论员建议进一步阅读相关主题,引用了《Surveillance Valley》和《Means of Control》。一个反复出现的主题是对该网站实际分析 Palantir 行动有效性的怀疑,认为花哨的呈现方式会分散对实质性分析的注意力。

这是一个PDF文件片段。

这次黑客新闻的讨论围绕着保罗·克鲁格曼(未来的诺贝尔奖得主)1978年发表的论文《星际贸易理论》。该论文以幽默的方式探讨了星际贸易的经济复杂性,特别是如何计算近光速旅行商品的利息,并考虑时间膨胀。 用户们觉得这篇论文对一个“荒谬”主题的认真分析很有趣,并注意到它与典型的经济研究形成了对比。对话延伸到相关的科幻概念——星际社会中的金融(如《海王星的后代》和《行星买家》等书中所描述的),太空中的材料价值,以及星际旅行巨大的能源需求。 几位评论者强调了克鲁格曼后来的职业生涯,以及这篇论文由一位以反对基础研究而闻名的参议员资助的讽刺意味。讨论最终涉及星际贸易的可行性,并得出结论认为,在没有获得巨大的能源资源的情况下,这很可能是不可能的,因此戴森球群可能是一个必要的先决条件。

更多

联系我们 contact @ memedata.com