本指南概述了如何使用“餐巾纸计算法”(napkin math)来估算大模型(LLM)推理的 GPU 集群扩展规模及每用户成本。 **关键机制:** * **瓶颈所在:** 大模型推理受限于内存带宽,而非计算能力。若无优化,矩阵乘法会因重复处理整个对话历史而浪费算力。 * **优化方式:** 使用 **KV 缓存(KV-Caching)** 存储之前的 Token 状态,将计算密集型的历史重处理过程,转变为每次前向传播仅生成单个 Token。 * **架构:** 诸如 NVIDIA B200 等现代芯片具有极高的算力与内存比(562:1)。为避免 GPU 空转,必须增大批处理大小($B$),直到计算需求与内存带宽相匹配。 **扩展现实:** * **容量:** 虽然理论计算显示可以实现高并发,但实际限制取决于显存(VRAM)。在考虑模型权重和 KV 缓存(通过 **分组查询注意力机制 Grouped-Query Attention** 和 **分页注意力机制 PagedAttention** 进行优化)后,单张 B200 显卡在高负载下可稳定服务 40-60 位用户;在典型的聊天场景中(由于存在空闲时间),可服务 300-800 位用户。 * **成本:** 若按每小时 4 美元的租赁价格计算,服务 300 位并发用户,每位用户每小时的成本约为 **0.013 美元**,即每月约 **9.36 美元**。
AMD 已确认将在今年 7 月恢复消费级 Ryzen 9000 系列处理器上的透明安全内存加密(TSME),即 Memory Guard 功能。
TSME 是一项固件级功能,通过对 RAM 中的数据进行加密,以防止物理“冷启动”攻击。尽管该功能此前已在非 PRO 版本的 Ryzen 芯片上提供,但在今年早些时候的 AGESA 1.2.7.0 固件更新中被悄然移除。这一举动引发了社区的担忧,特别是在 *Ars Technica* 的安全审计披露 Ryzen 9000 系列硬件无法再使用该功能之后。
起初,AMD 对此变更未作明确解释,导致外界猜测该公司是为了将标准消费级 CPU 与面向商用的 Ryzen PRO 系列产品区分开来而禁用了该功能。然而,在收到大量社区反馈后,AMD 改变了立场。公司在一份官方声明中澄清,其致力于维护安全功能,并确认未来的 BIOS 更新将恢复用户在非 PRO Ryzen 9000 台式机上启用 Memory Guard 的能力。
CME集团已对美国商品期货交易委员会(CFTC)提起诉讼,旨在挑战其对Kalshi比特币永续合约的批准。尽管CME将诉讼理由包装为监管安全问题,但核心焦点在于关键的分类定义:CME希望将这些产品从“期货”重新归类为“掉期(Swaps)”。
这种区别至关重要,因为掉期交易受到更严格的机构专属法规限制,实际上将散户投资者拒之门外。从本质上讲,这是占据市场主导地位的巨头所采取的防御性举措。CME的商业模式依赖于有到期日的传统期货合约,这迫使交易者进行“展期”操作,从而产生持续的费用。而永续合约无需到期,消除了“展期”需求,直接威胁到CME以费用为基础的收入来源。
归根结底,这场诉讼是对金融“永续化”趋势的回应。通过试图将这些产品纳入掉期规则的监管框架,CME旨在保护其市场主导地位,以抵御更高效的技术冲击。尽管CME声称是出于对投资者风险的担忧,但其法律行动表明,他们已意识到永续合约是市场不可避免的演变方向。CME等老牌机构并非为了阻止变革,而是在面对更便捷、创新的替代方案时,试图减缓其传统商业模式的瓦解。
Tiny 是一门高性能的并发编程语言及运行时系统,专为速度与灵活性而构建。它采用基于栈的字节码、高效的解释器以及即时(JIT)编译器,以实现原生级别的执行速度。
**关键技术特性:**
* **性能:** 具备操作系统级多线程、JIT 加速的热点循环,以及用于优化数据访问的宿主内存镜像功能。
* **灵活类型:** 默认提供动态类型,并支持可选的静态提示、联合类型及泛型。
* **现代设计:** 采用结构化(基于形状)类型系统、通过嵌入实现的类组合,以及强大的模式匹配。
* **并发:** 利用 `spawn` 在多个 CPU 核心上执行并发任务,并为共享状态提供安全、自动化的 `lock` 机制。
* **可扩展性:** 集成原生 WebAssembly 扩展,并支持内嵌 Go 代码。
* **开发体验:** 内置语言服务器 (LSP)、模式验证、UI 容器,以及用于 Web 服务和自动化的丰富标准库。
Tiny 代码既可以作为脚本运行,也可以打包成轻量级的独立可执行文件。凭借快速原型开发与系统级性能的结合,Tiny 专为高效、现代的应用程序开发而设计。相关文档及二进制文件请访问 [tiny-lang-docs.github.io](https://tiny-lang-docs.github.io)。
为了展示其托管 Postgres 服务的性能,ClickHouse 推出了 **PostgresBench**,这是一个针对事务型(OLTP)工作负载的开源、透明且可复现的基准测试工具。该项目使用标准的 `pgbench` 工具和类似 TPC-B 的工作负载,评估了托管 Postgres 服务在真实的重写入条件下的表现。
该基准测试通过在所有受测提供商之间保持基础设施、工作负载参数和配置设置的一致性,来强调结果的稳定性。通过专注于单节点性能并隔离存储影响,测试结果揭示了一个关键的行业见解:**Postgres 的性能瓶颈往往在于存储延迟,而非计算能力。**
基准测试结果表明,与依赖网络附加存储或共享存储(如 EBS)的服务相比,采用与计算资源同地部署的 NVMe 存储的架构(例如 ClickHouse 的托管 Postgres 产品)在性能上具有显著优势,尤其是在高频写入的场景下。
ClickHouse 已将完整的测试方法、原始数据和基准测试脚本在 GitHub 上公开。他们邀请社区对这些结果进行验证、贡献新的测试用例,并提交其他 Postgres 服务的性能数据。该项目旨在成为一个权威且中立的参考标准,基于事实和可复现的数据来比较各家托管 Postgres 服务提供商。
**make-look-scanned** 是一款将整洁的 PDF 文档转换为逼真数字扫描件的工具。通过对页面进行栅格化处理并应用一系列特效流程,它能够模拟物理打印件的瑕疵,包括歪斜、灰度、纸张底色、噪点、模糊、边缘阴影以及 JPEG 压缩痕迹。
该项目提供两种主要运行方式:
* **命令行界面 (CLI):** 基于 Go 语言编写的二进制程序,使用 MuPDF 进行高质量栅格化。默认采用确定性处理(基于内容的哈希),但也支持通过 `config.toml` 配置文件或明确的 CLI 参数进行自定义随机化与设置。
* **Web 端:** 基于 WASM 的浏览器版本,使用 PDF.js 进行渲染。它以单个独立的 HTML 文件形式存在,支持离线使用,无需外部依赖或服务器端处理。
核心功能包括针对每种特效的可调参数,以及定义可复用预设的能力。由于对 MuPDF 的依赖,CLI 版本采用 AGPL-3.0 许可证;而浏览器版本则使用采用 Apache-2.0 许可证的 PDF.js。两个版本都会移除原有的可选中文字,确保输出内容真实还原扫描文档的效果。
随着美伊地缘政治局势缓解以及能源成本下降,彭博农业现货指数已大幅回落。美国银行全球研究部策略师达里娜·科瓦尔斯卡(Daryna Kovalska)认为,这种导致玉米价格跌至每蒲式耳4.40美元的投机头寸“清洗”已经过度。
尽管由于美国降雨量改善,市场情绪有所降温,但科瓦尔斯卡认为风险只是被推迟,而非消除。她对玉米市场保持建设性看法,尽管已将2026年的上涨目标调整为每蒲式耳5.50美元。支持潜在供应冲击的关键因素包括:
1. **持续的天气风险:** 尽管情况有所缓解,但内布拉斯加州等主要产区的严重干旱依然存在;而即将到来的历史性厄尔尼诺现象可能会使巴西产量减少10%。
2. **化肥供应受限:** 霍尔木兹海峡的不确定性可能会延迟运往巴西的关键氮肥供应,从而可能影响作物产量。
3. **中国需求:** 预计170亿美元的美中贸易协议可能引发玉米出口激增,从而显著收紧供应。
科瓦尔斯卡最终认为,全球供应面临的长期威胁依然强大,足以在市场重新校准时引发价格反弹。
自 20 世纪初以来,芭蕾舞鞋的设计几乎停滞不前,这主要受限于芭蕾舞界对传统的刻板坚持、高昂的制造成本,以及对特定外观审美需求的追求。虽然传统的布料与浆糊制舞鞋仍是行业标准,但像 Gaynor Minden 和 act’ble 这样的创新者已经引入了合成材料和 3D 打印设计,旨在提升表现并减少损伤。
然而,这些技术的广泛应用面临着重大障碍。除了在小众市场进行研发所带来的财务风险外,进步还受到“门槛文化”的阻碍;教师、总监甚至舞者本人,往往因为审美偏见、个人喜好或害怕背离传统而拒绝使用现代舞鞋。
在包容性鞋履方面也存在类似的困境。尽管在 2020 年“黑人的命也是命”(Black Lives Matter)运动后,行业曾短暂扩大了肤色系列的选择范围,但经济压力和供应链的现实导致许多品牌选择了撤退。专家认为,真正的进步需要将重点从死守传统转向优先考虑舞者的职业生涯长久性与包容性;但在这样一个资源匮乏且文化保守的行业中,实现这一目标仍然是一个缓慢的、如同“龟速”般的过程。
一位联邦法官驳回了前总统乔·拜登阻止发布其2017年与代笔者马克·兹沃尼泽(Mark Zwonitzer)访谈的删节版笔录和录音的请求。传统基金会根据《信息自由法》寻求获取这些记录,因为它们是特别检察官罗伯特·赫尔(Robert Hur)2024年调查拜登处理机密文件一事的核心材料。
在报告中,赫尔援引这些录音作为拜登“认知能力下降”的证据,这一说法激起了公众对这些档案的兴趣。尽管现属特朗普政府领导下的司法部表示打算向国会公布这些材料,但拜登以隐私担忧为由,寻求初步禁令以阻止其披露。
地区法官达布尼·弗里德里希(Dabney Friedrich)驳回了拜登的动议,裁定这些执法材料中“极其强烈的公共利益”超过了他的隐私主张。尽管法官将该命令暂停了三周,以便哥伦比亚特区巡回上诉法院对此事进行审查,但她表示拜登在实质问题上胜诉的可能性不大。这些记录因突显了拜登的记忆力问题,仍处于这场持续法律诉讼的中心。
最新披露的文件显示,中央情报局(CIA)在2021年五天内突然将其对新冠病毒起源的立场从“实验室泄漏说”转变为“中立”。高级情报官员詹姆斯·厄德曼(James Erdman)的证词和内部简报显示,这一变化发生在2021年6月的一次简报会后不久。在会上,安东尼·福奇(Anthony Fauci)博士极力推崇“自然起源说”,并引导情报官员接触支持该观点的特定科学家。
根据一份简报摘要,一名未具名的中央情报局雇员承认,在受到外部干预后,该机构放弃了实验室泄漏的结论。包括前国家情报总监图尔西·加巴德(Tulsi Gabbard)在内的举报人和批评者认为,这种转变是有意为之,旨在压制实验室起源的证据,并保护美国国立卫生研究院(NIH)免受有关“功能获得性”研究资金的审查。尽管中央情报局后来因数据相互矛盾而难以得出明确结论,但该机构在2025年表示,实验室起源的“可能性更高”。这些披露引发了国会持续的调查,旨在查明政治压力和外部影响(特别是来自福奇博士的影响)是否损害了情报界对大流行病起源的客观分析。
一家名为 Qontour 的营销代理机构为约翰·柯尼希(John Koenig)的热门项目《晦涩悲伤词典》(The Dictionary of Obscure Sorrows)建立了一个未经授权的网站。该项目旨在编录独特且以人为本的情感,而该网站不仅刊载了柯尼希畅销书的全本内容,还配有 AI 生成的图像,并提供了一个利用 AI 生成新“悲伤”的工具,这与该项目的初衷背道而驰。
尽管 Qontour 声称自己是“粉丝”,但该网站实际上是他们用来展示 AI 与网页设计能力的案例作品。他们通过亚马逊联盟链接将项目商业化,且该网站在搜索结果中的排名现已超过柯尼希的官方页面。这导致了广泛的混淆,许多用户甚至 AI 聊天机器人误将此盗版网站视为官方渠道,并质疑柯尼希的原作是否由 AI 生成。
柯尼希本人并未受邀参与且未授权该网站,他是这一日益增长趋势的受害者:即代理机构在未经许可的情况下,利用生成式 AI 对人类创作者的劳动成果进行重新包装并以此牟利。此案例凸显了 AI 的“原罪”——即对人类表达的未经授权的开发利用——同时也反映了作者们在 AI 主导的数字环境中捍卫作品掌控权时所面临的日益严峻的挑战。
美国联邦选举委员会(FEC)已下令前加州国会议员埃里克·斯沃韦尔(Eric Swalwell)退还其在竞选州长期间筹集的30,075美元竞选捐款。根据FEC的一封信函,斯沃韦尔在四月份退出竞选后,未能按照法律规定退还所有捐款。该机构警告称,若未能在7月20日前完成合规,可能会导致审计或法律强制行动。
斯沃韦尔在遭遇性侵指控后,于四月份结束了竞选并辞去国会议员职务,但他否认了这些指控。报告指出,即使在结束竞选后,他的委员会仍继续筹集资金,并花费了超过90万美元用于法律费用和媒体咨询。
FEC坚持认为,大选捐款不能挪作他用,并拒绝了关于延长退款期限的请求。斯沃韦尔及其法律代理人均未回应置评请求。与此同时,他空出的国会席位仍处于特别选举阶段,州参议员艾莎·瓦哈布(Aisha Wahab)和前都柏林市长梅丽莎·埃尔南德斯(Melissa Hernandez)目前正在竞争该任期的剩余席位。
乌克兰加强了针对俄罗斯的远程无人机袭击行动,近期袭击了位于前线约2000公里外的秋明州的一家炼油厂。尽管地区州长亚历山大·摩尔声称防空系统击退了袭击,并未造成损失,但包括浓烟的视觉证据以及当地关于爆炸和应急车辆出动的报道在内的相互矛盾的消息表明,该设施可能遭到了打击。
此前,上周针对莫斯科一家炼油厂发动了大规模无人机群袭击,这标志着泽连斯基政府已转向针对俄腹地的激进打击战略。尽管克里姆林宫威胁要进行报复,乌克兰仍持续针对俄罗斯的关键能源基础设施进行打击。这些复杂的远程行动助长了俄罗斯的指控,即基辅正在从西方盟友那里获得重要的目标情报。
2026年6月19日,唐纳德·特朗普总统在安德鲁斯联合基地公布了一架全新的波音747-8豪华客机,该机将作为临时“空军一号”使用。这架飞机由卡塔尔政府于2025年赠送给美国。
在发布会上,特朗普总统强调了该机巨大的尺寸,指出其规模几乎是现有总统机队的两倍。他将其描述为“世界上最豪华的飞机”,并赞扬了其独特的工艺。空军方面证实,该机已完成最终的政府改装,目前正开始进行交付飞行。
虽然这架飞机是获赠的,但空军在购买和租赁额外的波音747-8以进行机组训练和确保技术安全方面仍产生了相关费用。这一新成员将作为现有机队的补充,现有机队中的部分飞机已服役超过35年。这架临时飞机的到来,正值波音公司在交付其主要的下一代机队方面面临严重延误之际,预计该机队要到2028年才能具备飞行条件。空军官员强调,该项目以加速进度执行,旨在确保三军统帅的安全。
千载难逢的机会。通过当地人和艺术家之眼去体验一个全新的国家和文化,是一段值得永远珍藏的经历。凯蒂(Katie)与千佳子(Chikako)在京都进行的 VAWAA 日本书法之旅。
这篇文章将当代自由派运动描述为具有破坏性,并指出其意识形态源于对西方文明的仇恨。作者认为,激进分子和媒体利用林肯纪念堂倒影池的维护问题作为武器,意图诋毁特朗普政府。
文中指出,尽管媒体聚焦于藻类生长问题,试图将政府耗资1400万美元的修复工程描绘成一次失败,但他们却忽略了一个事实:此类维护工作是循环性的必要措施。作者声称,激进分子已从线上抗议转向了主动破坏,包括损坏水池底部和干扰维护人员工作。作者认为,这些行为并非孤立事件,而是“觉醒派暴徒”(woke mob)为了抹黑国家自豪感和西方历史象征而进行的更广泛、有组织的行动的一部分。归根结底,文中叙述认为,媒体充当了这些煽动者的喉舌,蓄意将破坏行为曲解为政府无能的证据,从而助长反特朗普的宣传。