每日HackerNews RSS

## 苹果:面向未来的50年 苹果正在庆祝50年的创新,强调持续关注未来的发展,而非仅仅回顾过去。该公司设计旨在丰富人们生活的工具和体验。 苹果广泛的产品线包括Mac、iPad、iPhone、Watch、Vision、AirPods以及各种娱乐和家居产品,以及配件。除了硬件,苹果还提供包括Apple One、Apple TV+、Apple Music和App Store等全面的服务生态系统。 该公司通过Apple Store(包括天才吧和Today at Apple)、在线资源以及专门为企业、教育、医疗保健和政府提供的项目提供强大的支持。苹果还优先考虑可访问性、环境责任和包容性等核心价值观,以及关于公司本身及其领导层详细的信息。

## 苹果50周年 - Hacker News 讨论总结 苹果最近发布的一个庆祝50周年的网页在Hacker News上引发了不同的反应。许多人觉得庆祝视频令人失望,期望能有更具互动性的体验,包含产品细节和销售数据。一些用户在动画显示方面遇到了问题,通常可以通过更换浏览器或调整辅助功能设置来解决。 讨论延伸到苹果的演变,一些人惋惜苹果从开放、可破解的平台(如早期的Apple II)转变为更封闭、类似家电的生态系统。另一些人则为苹果对易用性的关注及其对普通用户的积极影响辩护。 许多评论员提到了其他的苹果周年庆活动,包括在Apple Park举行的保罗·麦卡特尼演唱会和在计算机历史博物馆举办的座谈会。关于苹果的当前发展方向也存在争论,一些人认为该公司现在专注于最大化利润而非创新。总的来说,这次对话展现了人们与苹果之间复杂的关系——对过去成就的赞赏以及对现状的批评。

## 人工智能营销 BS 指数 受物理学中“谬误指数”的启发,Bastian Rieck 提出一个“人工智能营销 BS 指数”,用于评估在人工智能产品被过度炒作的时代,营销材料的可信度。该指数旨在识别并评估过于热情或具有误导性的说法。 从 -5 分(给予信任)开始,得分会因以下行为而增加:无正当理由创造术语(+10 分),错误使用科学术语(每次 +10 分),以及使用“这不是 X,而是 Y”之类的修辞手法(+20 分)。 更高分数会授予以下行为:援引“自然”或“宇宙” (+20 分),无根据使用“涌现属性” (+20 分),炫耀常春藤盟校 (+20 分),缺乏可证伪的主张 (+30 分),以及无法验证的研究合作 (+40 分)。 该指数仍在完善中,旨在帮助过滤掉空洞的营销“氛围检测”,并识别真正有价值的人工智能创新。

对不起。

## git-bayesect: 贝叶斯Git二分查找 `git-bayesect` 是一个用于识别引入事件发生概率变化的提交的工具(例如,不稳定的测试)。与传统的 `git bisect` 不同,它使用贝叶斯推理,只需要一个变化*已经*发生,而不需要精确的失败率。 它通过迭代地缩小可能的提交范围,基于最小化预期熵来选择下一个要测试的提交。该工具巧妙地使用 Beta-Bernoulli 共轭性来处理未知的失败概率。 **关键命令:** * `git bayesect start --old <COMMIT>`:开始二分查找。 * `git bayesect pass --commit <COMMIT>`:记录一次成功的测试。 * `git bayesect prior --commit <COMMIT> --weight <value>`:设置关于某个提交的先验信念。 * `git bayesect run <command>`:使用给定的命令自动化测试。 你还可以基于文件名或提交消息/diff内容设置先验概率,以获得更准确的结果。提供了一个演示仓库和脚本来帮助你入门。

## Git Bayesect:用于非确定性错误的贝叶斯二分法 一个新的工具“git bayesect”解决了使用Git调试非确定性问题的难题。传统的`git bisect`需要一致的错误复现,这对于不稳定的或概率性错误来说是不可能的。 Git Bayesect使用贝叶斯方法来估计一个提交导致错误的概率,即使结果不一致。用户提供通过/失败的观察结果,该工具会智能地选择下一个要测试的提交,以达到最大的效率。 讨论强调了该工具在嘈杂基准测试中性能回归的潜力,以及直接输入原始基准测试分数的可行性。开发者确认目前支持对单个提交的重复观察,有效地将试验次数纳入贝叶斯更新,并且添加批量观察入口点将是直接的。底层的数学原理在开发者的网站上有详细说明。

## SwiftLM:快速原生 MLX 推理服务器 SwiftLM 是一款高性能、原生 Swift 推理服务器,专为 Apple Silicon 设计,用于运行 MLX 模型,并提供与 OpenAI 兼容的 API。它消除了 Python 和全局解释器锁 (GIL) 的开销,从而实现闪电般的速度。 主要特性包括直接加载 HuggingFace 模型并使用 Safetensors 解析,以及集成的 TurboQuantization——一种混合量化技术,在显著压缩内存(KV 缓存高达 3.5 倍)的同时,几乎没有精度损失。一项实验性的 SSD 流式传输功能允许通过直接从 NVMe SSD 交换 MoE 层到 GPU 来运行大型模型(122B+ 参数)。 SwiftLM 提供精细的内存控制,并包含用于设备端推理的原生 iOS 应用程序。它在 Apple M 系列芯片上进行了基准测试,并优先考虑稳定性,避免了可能导致系统崩溃的大型模型问题。它提供预构建的二进制文件以供快速设置,并支持标准的 OpenAI API 端点。

## TurboQuant & SSD 流式传输用于大型模型 SharpAI 发布了一个项目 (github.com/sharpai),该项目能够在 Apple Silicon 上运行大型的 100B+ 参数混合专家 (MoE) 模型,特别是 M5 Pro 和 iPhone 13 Pro。他们通过两种关键技术实现这一点:**TurboQuant KV 压缩**,通过优化的 C++ 和 Metal 着色器将 KV 缓存大小减少 4.3 倍,以及 **SSD 专家流式传输**,以 9 GB/s 的速度仅将活跃的专家权重从 NVMe 存储流式传输到 GPU。 这使得仅使用 2.69GB 的 GPU VRAM 即可进行 122B 参数模型的推理。虽然该项目展示了技术可行性,但评论员指出缺乏全面的基准测试,特别是关于每秒令牌 (tokens/second) 性能的测试。 一个反复讨论的焦点是“氛围编码”的兴起——使用像 Claude 这样的工具从论文中快速生成实现,以及缺乏彻底测试和基准测试的贡献是否有价值。尽管存在这种争论,但其他人强调了在当前资源限制下优化越来越重要的意义。

Unicode字符超出基本多文种平面(BMP)需要不同的UTF编码处理方式。UTF-8和UTF-32使用4字节序列直接映射码点来表示这些字符,而UTF-16则采用“代理对”系统。 由于UTF-16使用16位“码元”(最大值65,535),无法直接表示更高的码点。相反,它利用两个保留范围——高代理和低代理——来*表示*这些字符。一个补充字符被编码为一个高代理*后跟*一个低代理的组合。 这些代理对应始终一起出现,并且在文本处理期间(换行、高亮显示、计数)不得拆分。您不会在UTF-8或UTF-32编码中找到单个代理或这些对。本质上,UTF-16使用这种解决方法来在其16位结构内表示完整的Unicode字符范围。

对不起。

## 美国贫困率出乎意料地高,尽管经济在增长 传统的经济衡量标准在比较贫困水平时可能具有误导性。牛津经济学家奥利维尔·斯特克开发了“平均贫困”——即赚取1美元(按购买力调整)所需的平均时间——以提供新的视角。他的研究表明,尽管平均收入较高,美国经历的“平均贫困”比大多数西欧国家*显著*更高。 目前,在美国赚取1美元需要63分钟,大约是德国(26分钟)、法国(31分钟)和英国(34分钟)所需时间的两倍。虽然美国最贫困的州密西西比的人均GDP与德国相当,但美国不断上升的收入不平等意味着更大比例的人口正经历严重的经济压力。 斯特克的数据显示,自1990年以来,美国的“平均贫困”实际上在*增加*,即使经济在增长,也是因为不平等现象超过了收入增长。相反,收入分配更稳定的欧洲国家已经看到“平均贫困”有所下降。这表明,经济增长本身并不能保证减少贫困;财富的分配方式至关重要。

一篇最近在Hacker News上被重点讨论的文章,探讨了一种新的贫困衡量方法,结果显示美国正在落后于欧洲。该指标考虑了赚取1美元所需的时间,并结合了收入分配和商品成本——不同于人均PPP等传统衡量标准。 这篇文章引发了争论,一些用户认为结果与直觉不符,特别是与欧洲停滞不前相比,美国在新冠疫情期间“平均贫困”显著下降。讨论的中心是该方法论,一位评论员指出,该指标对拥有更多亿万富翁存在惩罚。 其他人质疑其逻辑,提到了最低工资的差异,而一些人则认为这种方法更准确地反映了“付出更多获得更少”的现状,并且更好地比较了购买力。对话还涉及了与基尼系数和较老的经济指标之间的潜在相关性。

## 人工智能的隐藏成本:在不知情的情况下多付钱 人工智能公司正在悄悄地通过按*token*(子词单元)收费,而不是按词收费来抬高用户成本。这个看似微小的细节导致了显著的价格差异,相同的请求根据供应商(OpenAI、Google、Anthropic等)的不同,成本可能高出高达60%。 核心问题是:**token缺乏标准化。** 每家公司使用自己的“tokenizer”(将文本分解为token的系统),导致对相同内容token数量的计算不同。这对于非英语语言影响尤其大,例如印地语和阿拉伯语,由于训练数据存在偏差,token成本比英语高*四到五倍*。 目前,价格差距巨大——截至2026年3月,最便宜和最昂贵的模型之间高达420倍。这种不透明性类似于早期的云计算,供应商使用不可比的计算单位。 **TokensTree** 旨在通过提供跨供应商的token记账和“SafePaths”(缓存解决方案,可减少冗余计算并规范token成本)来解决这个问题,最终促进一个更透明、更高效的人工智能经济。他们旨在使token使用更加公平和环保。

一个黑客新闻的讨论指出,像OpenAI、Google和Anthropic这样的AI公司根据“token”而不是单词来收费,导致某些语言的成本显著提高(高达60%)。核心问题并非故意歧视,而是token的确定方式——很大程度上取决于模型训练数据中字符序列(“n-gram”)的频率。 由于英语在训练数据中占主导地位,用token来表示相同的信息量所需的token数量比其他语言少。本质上,你支付更多是因为使用这种token化方法处理非英语文本在计算上更昂贵。 评论员指出,像中文这样的表意文字缺乏数据,并质疑用更平衡的数据集重新训练模型是否可以缓解这个问题,但这样做可能在经济上不可行。一些人认为这种定价模式具有欺骗性,而另一些人则认为这合理地反映了实际的处理成本。

Meta 正在利用人工智能彻底改变美国的混凝土生产,旨在提升国内制造业、可持续性和效率。目前,美国大约进口 20-25% 的水泥,这影响了就业并阻碍了对美国标准的遵守。Meta 的新型人工智能模型 **Bayesian Optimization for Concrete (BOxCrete)** 加速了传统上缓慢且昂贵的混凝土配比设计过程。 BOxCrete 智能地探索配方,从数据中学习,以推荐满足强度、成本和可持续性目标的混合物——特别是利用国内采购的材料。成功的应用包括在 Meta 位于明尼苏达州罗斯芒特的的数据中心使用的更坚固、更快固化的混凝土,强度提升速度快 43%,并减少了裂缝。 Meta 已经将 BOxCrete 作为开源软件发布在 GitHub 上,合作伙伴如 Amrize(一家大型水泥生产商)和 Quadrel(一家混凝土行业软件提供商)已经将其整合到他们的工作流程中。该举措支持将制造业迁回国内的趋势,为自 2020 年以来恢复的超过 110 万个美国就业岗位做出贡献,并加强了价值 1300 亿美元的混凝土行业。Meta 的长期愿景是行业范围内向人工智能驱动的配比设计转变,以实现更具弹性和可持续性的未来。

## AI 与美国混凝土:摘要 最近的 Hacker News 讨论集中在 Meta 的新型 AI 模型上,该模型旨在优化水泥和混凝土配方,特别是使用国内采购的材料。目标是加快研发过程,目前该过程受到漫长的养护和测试时间限制。 该公告引发了怀疑,评论员质疑在需要可验证的科学严谨性的领域对 AI 的依赖,并对潜在的失败表示担忧——引用了过去的事件以及优先考虑速度而非安全的风险。有人认为这是对关税的回应,以及推动美国水泥工业的举措,目前该行业严重依赖进口(2024 年为 22%,主要来自土耳其、加拿大和越南)。 其他人强调了混凝土工作的固有复杂性,强调了在多个学科中专业知识的必要性。虽然一些人认为它可能是一个有用的工具,但许多人表示难以置信,最初怀疑是愚人节玩笑。对话还涉及了相关的进展,例如现场混凝土搅拌车。

## Zerobox:轻量级、安全的代码沙箱 Zerobox是一个跨平台工具(macOS, Linux,计划支持Windows),用于安全地运行不受信任的代码,由OpenAI Codex的沙箱运行时提供支持。它采用“默认拒绝”原则,除非明确允许,否则会阻止文件访问、网络请求和环境变量继承。 主要特性包括:通过`--secret`和`--secret-host`进行**凭证注入**(传递API密钥,而无需将其暴露给进程),使用`--allow-read`和`--allow-write`进行**文件访问控制**,以及使用`--allow-net`和`--deny-net`进行**网络过滤**。Zerobox提供灵活的环境控制,允许继承所有、特定或不继承父环境变量。 它旨在安全地执行AI生成的代码、运行构建和进行测试,开销最小(~10毫秒,~7MB)。提供了一个TypeScript SDK用于程序化控制。安装通过shell脚本简单,使用通过命令行标志或SDK直接。Zerobox优先考虑安全性,防止在运行潜在有害代码时发生数据泄露和文件损坏。

## Zerobox:轻量级命令沙箱 Zerobox 是一款新的、跨平台的 CLI 工具,使用 Rust 编写,允许用户对命令进行沙箱化,并对文件、网络和凭据访问进行细粒度控制。它利用现有的操作系统级别的沙箱机制(如 Linux 上的 BubbleWrap),并基于 OpenAI Codex 的沙箱化 crates 构建,增加了密钥注入等功能。 该工具采用默认拒绝原则,除非明确允许,否则会阻止写入和网络 I/O。其关键特性是能够在不向沙箱化进程暴露密钥的情况下注入密钥,在网络调用期间使用占位符/替换技术。 Zerobox 并非 Docker 等完整虚拟化的替代品,但它提供了一种轻量级的替代方案,具有最小的开销(约 10 毫秒)以及保护本地 AI 代理执行和其他敏感操作的强大潜力。开发者正在积极寻求反馈,特别是来自使用 AI 代理的人员,并计划根据社区的意见改进文档和测试。 提出的问题包括需要强大的测试来建立可信度,以及有关网络控制的潜在平台限制。

对不起。

更多

联系我们 contact @ memedata.com