每日HackerNews RSS

## Arm推出数据中心芯片AGI CPU Arm宣布其首款自主设计的芯片**Arm AGI CPU**,基于Neoverse平台构建,旨在满足不断增长的AI基础设施需求。这标志着Arm的转变,从IP授权扩展到提供完整的处理器解决方案,为客户提供更多部署选择。 AGI CPU专为“代理AI”时代设计——即AI系统能够持续且自主地大规模运行。它专注于数千个核心上的高任务性能,优先考虑在数据中心功耗和散热限制内的持续负载。配置包括一个密集的272核刀片式服务器,以及一个液冷选项,每个机架拥有超过45,000个核心——**与当前x86系统相比,每个机架的性能提升超过2倍**,这归功于Arm的架构和高效的资源分配。 早期的合作关系表明了强大的生态系统支持,**Meta是主要客户**,与其共同开发用于其应用程序的CPU。其他发布合作伙伴包括Cerebras、Cloudflare、OpenAI和SAP。商业系统现已由ASRockRack、联想和Supermicro提供。Arm还在向Open Compute Project贡献参考服务器设计,以加速采用。 此次发布标志着Arm的新篇章,巩固了其为AI创新提供基础的承诺。

## Arm AGI CPU:摘要 Arm 发布了其首款量产芯片 AGI CPU,专为大规模人工智能基础设施设计。该 CPU 于 2026 年 3 月发布,最多拥有 136 个基于 Armv9.2 架构的 Neoverse V3 核心,支持 bfloat16 和 INT8 AI 指令,加速时钟频率为 3.7GHz。 AGI CPU 基于 3nm 工艺制造,提供出色的连接性,包括 96 条 PCIe Gen6 通道和 CXL 3.0 支持,以及高达 6TB 的 DDR5-8800 内存。它有三种型号可供选择——136 核旗舰版、128 核 TCO 优化版和 64 核内存带宽优化版。 Arm 的参考服务器在一个 10U、2 节点设计中,每片刀片包含 272 个核心,一个标准机架可容纳 30 片刀片。与 Supermicro 的合作提供了一种更密集的液冷解决方案,可容纳 336 个 CPU,总计超过 45,000 个核心。

## ARM 进入 CPU 市场,挑战性能声称 ARM 宣布进入服务器 CPU 市场,推出“ARM AGI CPU”,目标是 AI 基础设施。虽然宣称潜在性能可与 AWS Graviton5 媲美,且核心数更多,但专家质疑 ARM 提出的相较于英特尔 Clearwater Forest 和 AMD Zen 5 等 x86 平台,机架性能提升 2 倍的说法。 英特尔和 AMD 目前每套插槽提供的核心数明显更多,可能抵消 ARM 的每核心优势。具体而言,英特尔 Clearwater Forest 拥有每套插槽 288 个核心,而 ARM 只有 136 个。虽然 ARM 的 CPU 在非阵列操作应用中可能在每瓦性能方面表现出色,但 AMD 的 Zen 6 预计将进一步挑战 ARM 的地位。 该消息引发了关于 ARM 从 IP 授权转变为与客户(如 Ampere)直接竞争的问题。软银同时拥有 ARM 和 Ampere,引发了关于潜在整合的猜测。“AGI”这一名称本身也被一些人视为过于雄心勃勃的营销策略。

美国联邦通信委员会(FCC)已 фактически 禁止销售新的、外国制造的消费者路由器,理由是国家安全问题,并将其列入《安全网络法》下的“覆盖清单”。 这禁止批准新型号,但此前已获授权的路由器仍然可以合法销售和使用。 此举是在白宫评估的推动下,旨在减少美国对外国关键基础设施制造的依赖,并防御网络安全威胁——路由器与最近的网络攻击有关。 虽然FCC强调国家安全,但批评者指出,鉴于美国过去涉及路由器操纵的情报活动,以及几乎所有路由器目前都在国外制造(星链是罕见的美国例外),这存在虚伪之处。 一些人认为该政策是一种市场干预,旨在激励国内制造。 制造商可以寻求国防部或国土安全部的批准,或向FCC申请加入批准名单。

## 路由器禁令与虚伪辩论 一个有在思科路由器中安装后门的历史的国家——据报道是美国——现在正在禁止在国外制造的路由器。此举引发了黑客新闻的讨论,核心是潜在的虚伪和更广泛的安全形势。 许多评论员质疑路由器是否比大量存在漏洞的物联网设备构成更大的安全风险。虽然路由器控制着网络访问,但被攻陷的智能设备也可能暴露网络。一些人认为,这项禁令本身是一种地缘政治权力游戏,可能将选择限制在容易受到胁迫的国内供应商。另一些人则认为这只是国际间谍活动中的“以牙还牙”。 这场辩论还涉及现有的监控计划,如CALEA,以及国家从事它们谴责的活动所固有的虚伪。几位用户指出,美国自身也有监控历史,认为这项禁令并非出于安全考虑,而是出于控制和维持权力动态。一个关键点是,几乎所有路由器都是在国外制造的,即使是美国公司销售的路由器也不例外,星链是一个值得注意的例外。

必须启用 JavaScript 才能使用 Notion。请启用 JavaScript 以继续。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Lago (YC S21) 正在招聘增长团队的产品工程师 (getlago.notion.site) 1天前 | 隐藏 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系方式 搜索:

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

对不起。

--- 确认您的电子邮件地址 主题:深色模式 ::: 标题 ![Logo](https://...logo.png){width="200"} ::: # 确认您的电子邮件地址 您的确认码如下 - 请在您打开的浏览器窗口中输入它,我们将帮助您登录。 ::: 提示 中心 紧凑 # DFY-X7U ::: 如果您没有请求此电子邮件,请不用担心,您可以安全地忽略它。 ::: 页脚 Acme Inc. | 123 Main St [取消订阅](https://example.com/unsub) :::

## Show HN: Email.md – Markdown 到响应式 HTML 一个新的工具,**Email.md (emailmd.dev)**,旨在通过将 Markdown 转换为响应式、邮件安全的 HTML 来简化邮件开发。该项目在 Hacker News 上分享,引发了关于邮件格式挑战和现有解决方案的讨论。 许多评论者指出像 **MJML** 这样的工具在处理邮件 HTML 方面的流行,质疑 Email.md 是否增加了不必要的抽象。有些人认为 Markdown 输入对那些觉得比直接编写 HTML 更容易的用户来说很有价值,而另一些人则强调了 Markdown 到 HTML 转换过程中可能存在的注入漏洞等安全问题。 对话还涉及了对纯文本邮件的需求与 HTML 在图像和按钮等功能方面的优势,以及与邮件客户端兼容性(Gmail/Outlook)的持续斗争。一位用户甚至指出了一个相关的项目,用于创建一个 Neovim/Markdown 邮件客户端。开发者已经根据用户反馈添加了 Cloudflare Workers 支持。

## Hypura:在Mac上运行大型语言模型 Hypura 是一款专为 Apple Silicon Mac 设计的 LLM 推理调度器,它能够通过智能地将张量分配到 GPU、RAM 和 NVMe 存储器中,执行超过可用 RAM 的模型。它克服了在使用像 llama.cpp 这样的工具尝试加载过大的模型(例如在 32GB Mac Mini 上加载 31GB Mixtral)时遇到的崩溃问题。 Hypura 会分析硬件并优化张量放置,优先将经常访问的数据(范数、嵌入)放在 GPU 上。对于 Mixtral 等混合专家 (MoE) 模型,它仅从 NVMe 流式传输活跃的专家权重,将 I/O 减少 75%,并以 99.5% 的命中率使用神经元缓存。像 Llama 70B 这样的密集模型,也为 FFN 层采用了类似的流式传输方法。 该系统会根据可用内存自动调整预取和池大小,无需手动调整。Hypura 对于能够放入内存的模型没有额外开销,并为更大的模型提供可用的体验,甚至可以达到 Mixtral 2.2 tok/s 和 Llama 70B 0.3 tok/s 的速度。它通过 Cargo 提供,并包含一个与 Ollama 兼容的 API,以便与 OpenClaw 等工具轻松集成。重要的是,Hypura 主要*读取* SSD,从而最大限度地减少磨损。

## Hypura:Apple Silicon LLM 推理调度器 - 摘要 Hypura 是一种新的调度器,旨在通过智能利用 NVMe 存储来提升 Apple Silicon 上的 LLM 推理性能。它解决了 RAM 容量有限的问题,通过从磁盘流式传输模型权重,旨在实现运行比通常能放入内存更大的模型。 讨论集中在与现有方法(如 `llama.cpp` 的 mmap 功能)的性能比较,以及访问模式(顺序 vs. 随机)对 NVMe 通量(特别是对于混合专家 (MoE) 模型)的影响。虽然运行 1T 参数的模型是可行的,但目前速度太慢,无法进行交互式使用。重点正在转向优化较小 MoE 模型的性能,以实现每秒多个 token 的速度。 用户建议对 Qwen 3.5 和 Kimi 等最新模型进行基准测试,并强调 Apple Silicon(Pro、Max、Ultra)内的带宽等级对于实现最佳速度的重要性。人们对潜在的 NVMe 磨损表示担忧,但已澄清 Hypura 主要是一种读取工作负载。该项目旨在通过基于 Transformer 层执行的确定性特性来预取数据,从而超越操作系统分页。

## WolfGuard:符合FIPS标准的WireGuard替代方案 WolfGuard是WireGuard的直接替代品,通过wolfSSL库提供FIPS 140-2合规性。它由`wolfguard.ko`内核模块和`wg-fips`配置工具组成,两者都依赖于wolfSSL组件。安装过程会无缝地用符号链接(`wg`到`wg-fips`,`wg-quick`到`wg-fips-quick`)替换WireGuard二进制文件,同时保留现有配置(移动到`/etc/wolfguard`)。 WolfGuard将WireGuard的密码学映射到FIPS批准的算法:ECDH (Curve25519) 变为 SECP256R1,XChaCha20-Poly1305 变为 AES-256-GCM,Blake2s 变为 SHA2-256。性能与启用Intel CPU加速(`--enable-intelasm`)的加速WireGuard相当或超过,否则保持可比。 构建WolfGuard涉及编译wolfSSL和内核模块。FIPS认证构建需要单独的源代码存档和一个特定的`--enable-fips`标志。 认证和非认证构建是可互操作的,但与标准的WireGuard不兼容。 针对两种情况都提供了详细的构建说明,包括FIPS构建的内核模块哈希验证。 通过更新配置路径并使用`wg-fips`重新生成密钥,可以使用WolfGuard来使用现有的WireGuard playbook。

## WolfGuard:带有FIPS 140-3密码学的WireGuard - 摘要 WolfSSL发布了“WolfGuard”,它是WireGuard的一个分支,实现了FIPS 140-3认证的密码学。这解决了日益增长的FIPS合规性需求,尤其是在美国军政府部门,特别是小型企业应对CMMC要求。 讨论强调了一个常见的争论:FIPS标准往往落后于当前的密码学最佳实践,并且实施起来可能更复杂。虽然ChaCha20-Poly1305和Curve25519等算法更简单高效,但FIPS认证对于某些合规性需求是必要的。 WolfGuard用WireGuard首选的算法(如ChaCha20)替换为FIPS批准的替代算法(如AES-GCM)。人们对这种切换的潜在安全影响表示担忧,并提到使用更复杂的密码会增加实施错误的风险。另一些人指出,现代FIPS并不像以前那样过时。 最终,WolfGuard为需要FIPS合规VPN解决方案的组织提供了一个开源选项,即使这意味着牺牲一些性能或简单性。

## SentrySearch:用于行车记录仪画面的语义搜索 SentrySearch 能够使用自然语言快速搜索行车记录仪视频。它的工作原理是将视频分割成片段,使用 Google 的 Gemini Embedding 模型将每个片段嵌入为视频数据,并将这些嵌入存储在本地 ChromaDB 数据库中。 用户只需输入查询(例如“红卡车闯红灯”),查询也会被嵌入,然后与视频嵌入进行匹配。最相关的片段会自动剪辑并保存为剪辑。 **主要特点:** * **直接视频嵌入:** 无需转录或字幕 – Gemini 直接处理视频像素。 * **成本优化:** 预处理(降至 480p/5fps)和静帧跳过可降低 API 成本(索引 1 小时约 2.50 美元)。 * **易于设置:** 克隆 GitHub 仓库 ([https://github.com/ssrajadh/sentrysearch](https://github.com/ssrajadh/sentrysearch)),安装依赖项,并提供 Gemini API 密钥。 * **可定制:** 可以调整片段时长、重叠和预处理。 目前处于预览阶段,SentrySearch 支持 MP4 视频,并依赖启发式方法进行静帧检测。未来的改进旨在实现更智能的片段划分,并解决潜在的 API 变更。

## Gemini 与亚秒级视频搜索:摘要 一位开发者(sohamrj)构建了一个命令行工具,利用 Google 的 Gemini Embedding 2 实现对视频素材的亚秒级搜索。Gemini 现在可以直接将原始视频转换为 768 维向量,绕过传统的转录或帧字幕等方法。这使得自然语言查询(例如“绿车超车”)可以直接与视频内容进行比较。 该工具将素材索引到 ChromaDB,然后使用自然语言搜索自动剪辑匹配的片段。初步测试,使用行车记录仪素材,显示索引成本约为每小时 2.50 美元,通过跳过静态帧可以降低成本。 讨论强调了其潜力与担忧。虽然为安全、行车记录仪回顾以及潜在的内容审核等应用提供了强大的搜索能力,但该技术也引发了重大的隐私问题。担忧集中在潜在的广泛监控上,人工智能不断索引和分析视频流,可能因特定个人或活动而触发。开发者承认这些担忧,并希望通过开源、本地模型来解决隐私问题。Gemini 的替代方案也在探索中。

## Apple Business:面向企业的新型一体化平台 Apple 宣布推出 **Apple Business**,将于 4 月 14 日在全球 200 多个国家和地区上线,旨在简化各规模公司的业务管理。该平台将关键 Apple 服务——包括设备管理、商业电子邮件和日历,以及客户拓展——整合到一个安全统一的系统中。 主要功能包括 **内置移动设备管理 (MDM)**,并提供“蓝图”以便于设备设置和安全保障,以及使用 **自定义域名** 进行专业沟通的能力。企业还可以通过 **Apple 地图广告**(今夏在美国和加拿大推出)来提升其可见性,广告将出现在搜索结果和推荐地点中。 Apple Business 还通过工具简化品牌管理,以控制企业在 Apple 服务中的展示方式。它提供升级的 iCloud 存储空间和 AppleCare+ for Business 选项,以及配套的员工应用程序。现有的 Apple Business Connect、Essentials 和 Manager 用户将自动迁移,Essentials 订阅将于 4 月 14 日停止。该服务免费使用,并提供可选的付费升级。

## Apple商业发布总结 Apple将于4月14日发布“Apple Business”,作为一项免费服务在美国和200多个国家/地区推出,整合了Apple Business Connect、Essentials和Manager。 旨在为小型企业提供一套全面的工具,包括MDM、电子邮件、日历,以及可能提供的硬件折扣(MacBook起价499美元,享受教育优惠)。 讨论的重点在于这是否是一项永久免费服务,还是一次推广活动。 用户质疑账户管理,特别是更改公司详细信息,一些人认为可能需要创建新账户。 许多人认为这对微软在商业领域的统治地位构成了挑战(特别是Microsoft 365和Intune),尤其是在员工少于50人的公司中。 然而,一些人指出Apple在办公软件套件方面的历史弱点,以及Google Workspace和Notion等替代方案的日益普及。 此次发布也引发了对Jamf(一种流行的企业MDM)未来的问题,以及Apple的产品是否足以满足需要专门支持的大型组织。 也有人担心会出现类似于Apple Maps和App Store的广告“劣化”现象。

更多

联系我们 contact @ memedata.com