## 三元盆景:高性能、低内存语言模型 PrismML 发布了三元盆景,这是一种新型的 1.58 位语言模型系列(8B、4B 和 1.7B 参数),旨在实现高效性能。在他们之前的 1 位盆景模型的基础上,三元盆景通过利用三元权重(-1、0、+1)在内存使用和准确性之间取得了平衡。 这些模型比标准的 16 位模型内存占用小约 9 倍,同时在 MMLU、GSM8K 和 HumanEval+ 等关键基准测试中*优于*许多同等参数的模型。例如,8B 模型实现了 75.5 的平均基准分数,超越了 1 位盆景 8B,并与更大的模型(如 Qwen3 8B)竞争,尽管其尺寸明显更小。 三元盆景还提供令人印象深刻的吞吐量和能源效率,在 M4 Pro 和 iPhone 17 Pro Max 等平台上,运行速度比 16 位模型快高达 5 倍,并且能耗降低 3-4 倍。这些模型通过 MLX 在 Apple 设备上原生支持,并采用 Apache 2.0 许可证提供。它们代表了性能-尺寸权衡的转变,与 1 位系列相比,在内存略有增加的情况下,提供了一个更强大的模型。
## 语言模型中的“退缩”:所谓的“无审查”模型真的自由吗?
最新研究表明,即使是作为“无审查”销售的语言模型,也表现出一种微妙但普遍的偏见——一种对某些词语和话题的“退缩”。这种退缩不是拒绝回应,而是一种统计上的微调,降低了生成文本中出现“敏感”词语(例如与暴力、政治或侮辱性词语相关的词语)的概率。
研究人员在来自五家实验室的七个预训练模型中测量了这种退缩,包括来自谷歌、阿里巴巴、OpenAI和开源选项的模型。他们发现*所有*模型都表现出这种行为,商业过滤模型比开放数据模型表现出更强的退缩。即使是“拒绝消除”模型——那些被设计用来绕过安全限制的模型——仍然表现出退缩,这表明偏见嵌入在核心预训练数据中,而不仅仅是安全层。
这项研究强调,这不仅仅是关于避免明确的拒绝;而是对语言进行系统性的塑造。这引发了对信息微妙控制以及在大型语言模型背景下“无审查”的真正含义的担忧。该研究提供了一个新的框架来理解和量化这些偏见,为更透明和负责任的AI开发铺平了道路。
向门罗币项目捐款
通过向以下门罗币地址(通用基金)捐款,您将支持门罗币项目。如果您希望向特定提案捐款,请参阅所需资金。
888tNkZrPN6JsEgekjMnABU4TBzc2Dt29EPAvkRxbANsAnjyPbb3iQ1YBRk1UXcdRsiKc9dhwMVgN5S9cQUiyoogDavup3H
美国“杰拉尔德·R·福特”号航空母舰在克罗地亚进行了一个月维修后,重新部署到中东,此前该舰于三月份发生火灾。官方将事故归因于洗衣区意外起火,但事件引发了伊朗袭击的猜测,美国官员一再否认了这些说法。
“福特”号加入了“亚伯拉罕·林肯”号打击群,预计“乔治·H·W·布什”号将很快抵达,使美国在该地区的航母总数达到三艘。这种兵力部署与2003年伊拉克入侵时的情况相似,但规模较小。
在返回中东之前,“福特”号在加勒比海执行了任务,包括与毒品贩运和委内瑞拉相关的行动。该航母还面临着有关持续技术问题的报告,包括在长期部署期间发生的管道故障。
## 最高法院面临保密危机
近期最高法院机密信息泄露——继《多布斯案》判决泄露之后——正促使首席大法官约翰·罗伯茨采取果断行动。作者乔纳森·图利用棒球类比,敦促罗伯茨“保护本垒”,因为法院正面临日益严重的危机。
除了泄露事件本身,内部礼仪的崩溃也显而易见,大法官们公开批评彼此——以索托马约尔大法官对卡瓦诺大法官的评论以及卡根大法官和布雷耶大法官之间激烈争论的报道为例。最新泄露,发表在《纽约时报》上,揭示了关于“暗箱操作”的内部备忘录,以及对环保署规避法律裁决的担忧。
与《多布斯案》泄露不同,这次泄露似乎纯粹是出于恶意,旨在羞辱法院,而非影响判决。罗伯茨之前的调查,由联邦法警领导,未能取得成果。图利认为,罗伯茨现在必须克服顾虑,并让联邦调查局介入,确保调查的完全透明,以恢复公众信任并维护法院的诚信。法院长期以来的保密文化正在瓦解,需要采取果断行动以防止进一步损害。
## 霍尔木兹海峡中断引发科威特原油不可抗力
由于美国扣押伊朗货船导致局势紧张加剧,科威特宣布部分石油运输实施不可抗力。 科威特石油公司已通知客户,由于进入波斯湾受阻,可能出现交货延误。
此事件发生在上周海峡短暂重新开放之后,重新开放的条件是美国解除对伊朗石油出口的海上封锁——伊朗将此条件与安全通行挂钩。 伊朗警告说,如果其自身石油出口仍然受限,则无法保证霍尔木兹海峡的安全,并拒绝与美国进行新一轮谈判。
这一局势促使船只改变航线,并推高了油价。人们也日益担心伊朗支持的胡塞武装可能对巴布-曼德海峡构成威胁,从而影响替代出口路线。 一支美国代表团正前往巴基斯坦进行潜在谈判。
美国司法部据报道正在加强对2016年特朗普-俄罗斯勾结叙事起源的调查。关键人事变动预示着调查重点的转变,长期担任特朗普法律顾问的乔·迪杰诺瓦被任命为司法部长顾问,负责领导佛罗里达州Fort Pierce大陪审团的调查——同一法院的艾琳·卡农法官此前曾对特别检察官杰克·史密斯不利裁决。
与此同时,负责调查前中央情报局局长约翰·布伦南的检察官因据称抵制快速提出指控的压力而被撤职。一位与卡农法官有联系的高级助手也被添加到Fort Pierce团队。这些举动是在特朗普总统表达了他对之前面临的调查“正义”的渴望以及对先前问责努力进展不满意的背景下发生的。
调查范围已超出最初的起诉书(后来因程序问题被驳回),现在包括对布伦南的审查,可能与斯蒂尔档案有关。布伦南的法律团队对调查背后的潜在政治动机越来越担忧,特别是考虑到卡农法官之前的裁决。调查范围可能会扩大到包括从“通俄门”到1月6日事件,甚至审查杰克·史密斯的行为。
## 超越组织架构图:理解工作*真正*的完成方式
项目经常停滞,并非因为缺乏技能或努力,而是因为组织未能识别管理执行的“真实”地图——那些超越正式组织架构图的地图。这些隐藏的地图决定了工作*实际*的流程,并揭示了功能障碍的关键见解。
五个关键地图是:**专业知识**(人们*实际*咨询的对象)、**决策**(拥有实际权力的人,通常与正式批准不同)、**记忆**(流程背后的未明说历史与逻辑——当人们离开时很容易丢失)、**连接**(在团队之间架起桥梁的个人,携带重要的背景信息)以及它们*之间*的相互作用。
当这些地图与组织架构图一致时,一切运行顺利。脱节会产生摩擦、重复错误和误解。识别这些地图需要观察——注意反应、推诿以及谁影响决策——而不仅仅是依赖于职位描述。
对于管理者来说,识别和记录这些非正式结构至关重要。过度依赖少数关键人物将多个地图联系在一起会造成脆弱性。使这些地图可见可以暴露隐藏的优势、劣势,以及关于权力动态和能力的潜在令人不安的事实,但对于可持续的成功至关重要。
2013年,美国司法部政策转变为各州层面的大麻合法化铺平了道路,选择不在那些新兴大麻计划的州执行联邦禁令。如今,大约80%的美国人——超过2.55亿人——居住在允许某种形式的大麻合法获取的州,无论是娱乐用途还是医疗用途。
最初,科罗拉多州和华盛顿州于2012年率先行动,随后马萨诸塞州和伊利诺伊州等州扩大了医疗大麻的获取范围。最近,加利福尼亚州、密歇根州、新泽西州和纽约州等大州将娱乐用途合法化,改变了这一格局。
尽管娱乐市场不断兴起,但自2015年以来,已有15个州*增加*或扩大了医疗大麻计划,包括最近的内布拉斯加州和德克萨斯州的扩张,不断增加受合法大麻法律覆盖的美国人数量。这表明了全国范围内大麻自由化的一致且不断增长的趋势。
## 苹果宣布首席执行官过渡
多年猜测后,苹果公司宣布蒂姆·库克将于2026年9月1日卸任首席执行官,转任执行董事长。目前硬件工程高级副总裁约翰·特纳斯将在董事会一致批准后接替库克担任首席执行官。
库克于1998年加入苹果公司,2011年成为首席执行官,他将与特纳斯密切合作,确保平稳过渡。在他的任期内,苹果市值飙升超过1000%,达到4万亿美元,收入翻了四倍。作为执行董事长,库克将专注于与政策制定者沟通。
特纳斯是苹果公司工作25年的资深员工,在开发iPad、AirPods以及最近的iPhone和Mac创新产品中发挥了重要作用。他还倡导硬件设计中的可持续发展努力。阿瑟·莱文森将成为首席独立董事,特纳斯将加入董事会。该消息最初导致股价下跌,但随后大部分已恢复。
## 迫在眉睫的粮食危机与全球经济压力
美国农民正面临严峻危机,并因霍尔木兹海峡局势升级而加剧。他们已经负债累累,成本飙升,70%的美国农民报告说,由于价格大幅上涨,无力负担2024年所需的肥料——这场冲突使价格上涨更加严重。这不可避免地将导致作物产量下降和全球粮食价格上涨。
情况在美国南部尤为严重,但影响到全国各地的农民。除了肥料,联合燃料成本已上涨20-40%,进一步挤压农业企业。包括高盛在内的专家承认,肥料危机正加速发展,可能使数亿人陷入粮食不安全。
更糟糕的是,美国对伊朗港口的封锁,旨在向伊朗施压,引发了报复性威胁,扰乱波斯湾和红海等重要水道的航运。这种升级威胁着全球贸易,并已推高了油价——加利福尼亚州的平均油价接近每加仑6美元,英国正为燃料短缺做准备。由于看不到容易解决的方案,预计经济影响将显著恶化。
Lucebox 是一个专注于通过手动优化软件以适应特定硬件,从而优化大型语言模型 (LLM) 推理的项目,而不是依赖通用框架。他们的目标是使强大的 AI 在本地更易于访问,优先考虑隐私、成本效益和避免厂商锁定。
目前,Lucebox 发布了两个项目:**Megakernel Qwen3.5 0.8B**,适用于 RTX 3090 GPU,性能与苹果最新的芯片相匹配,吞吐量提高 2 倍(1.87 tok/J);以及同样适用于 RTX 3090 的 **DFlash DDtree Qwen3.5 27B**,使用推测解码和定制 CUDA 引擎,速度比自回归解码快高达 5.46 倍(207 tok/s)。
这两个项目都提供了详细的基准测试、说明文档,并以 MIT 许可证在 GitHub 上提供。它们利用了内核融合、推测解码和量化等技术,针对目标硬件进行优化,以最大限度地提高性能。未来的工作包括对 Ryzen AI MAX+ 处理器和异构 CPU/GPU 系统的优化。
## 美伊对峙与国内动荡:摘要
随着美国对伊朗实施的停火期即将结束,缓和局势的谈判仍然停滞不前。美国利用这段时间进行补给,破坏伊朗的金融,并封锁霍尔木兹海峡,严重影响了伊朗每日估计达5亿美元的石油收入,并可能长期损害其油田。伊朗试图绕过封锁的尝试,例如最近扣押“M/V Touska”号,已被迅速挫败。
然而,伊朗内部存在分裂。虽然革命卫队(IRGC)控制着关键资产,但正规军(Artesh)可能准备干预,以对抗革命卫队鲁莽的政策,并可能将国家稳定置于卫队议程之上。
与此同时,国内发展表明,针对所谓选举舞弊的镇压正在进行中。联邦调查局局长卡什·帕特尔声称存在证据,政治犯蒂娜·彼得斯据报道正在被转移以获得证人保护。司法部长布兰奇已聘请约瑟夫·迪杰诺瓦来构建针对那些参与被描述为旨在改变美国的“颜色革命”的阴谋案件。
## 传统金融关注预测市场
金融巨头查尔斯·施瓦布和Citadel Securities都在探索进入快速增长的预测市场领域,目前该领域由Kalshi和Polymarket等平台主导,后者在三月份的交易量达到236亿美元。然而,该领域面临监管审查,一些州指控其为未经许可的体育博彩,并担心内幕交易问题。
施瓦布首席执行官里克·沃斯特表示,未来可能会推出相关产品,但重点将是与长期财富积累相关的市场——*排除*体育、政治和流行文化博彩,因为赌徒的成功率较低。Citadel Securities也在密切关注相关发展,优先考虑流动性以及潜在的对冲投资风险的应用场景,尤其是在选举等重大事件中。
虽然Citadel目前对体育博彩不感兴趣,但两家公司都认为预测市场可以作为风险管理工具,并可能成为为客户提供新服务的途径。
## 量子计算与密码学:无需升级对称密钥
量子计算的兴起需要对**非对称密码学**(如RSA和ECDSA)进行转变,因为Shor算法暴露了其漏洞。然而,一个常见的误解是量子计算机也会削弱**对称密码学**(如AES和SHA-256),需要更大的密钥尺寸。**这是错误的。**
专家和NIST等标准化机构一致认为,现有的对称算法仍然安全。这种担忧源于对**Grover算法**的误解,Grover算法*确实*为暴力破解攻击提供了加速,但不足以需要增加密钥尺寸。并行化Grover攻击也会显著降低其有效性。
NIST甚至将AES-128指定为后量子安全基准,并明确允许其继续使用。虽然一些合规性规范(如CNSA 2.0)要求对所有操作使用256位密钥,但这并非由量子计算驱动的需求。
重点应放在过渡易受攻击的非对称系统上,而不是不必要地升级稳定的对称密码学。资源最好用于解决量子计算构成的*实际*威胁,而不是追逐推测性的风险。