这项研究调查了Transformer模型令人惊讶地学习和预测由排列线性同余生成器(PCG)生成的序列的能力,PCG是一种复杂的伪随机数生成器。尽管PCG比简单的生成器更复杂,Transformer仍然能够成功预测未知的PCG序列,即使仅限于预测单个输出位。 该研究表明了一种缩放规律:预测准确性随着模型和数据集的增大而提高,但对于非常大的模数(≥ 2<sup>20</sup>)需要课程学习——首先在较小的模数上进行训练。值得注意的是,当在多个PCG上同时训练时,模型会识别出共享的结构模式。 对模型嵌入层的分析揭示了一种有趣的聚类现象:输入被分组到旋转不变的聚类中,表明了一种在不同模数大小之间传递学习到的表示的机制。这项工作突出了Transformer学习复杂数学结构的能力,并深入了解了它们的内部表示。
人工智能正在迅速扩展到传统工作领域之外,并进入个人亲密关系的领域。大约20英镑,容易获得的“生物反馈”设备承诺通过实时调整提供个性化体验——学习并响应亲密的生物识别数据。
虽然看似无害,但这引发了重大的隐私问题。这些设备不仅仅是*做*某事,它们还在*观察*、*测量*,并可能*记录*关于用户反应和偏好的极其敏感信息——这些数据比典型的在线活动更具揭示性。
核心问题不是技术本身,而是这些高度个人数据的命运:它存储在哪里,谁可以访问它,以及如何保护它。这些数据很容易成为庞大的个人信息市场中的另一种商品,而大多数人更愿意将其保密。这些设备的便利性和新颖性正在微妙地超过必要的谨慎,突显了人工智能以意想不到和深刻的个人方式了解我们。
## 从“劣质代码”到规范驱动开发,借助Acai.sh
本文详细描述了从应对AI生成代码不一致性(“劣质代码”)的困境,到使用名为Acai.sh的工具,采用更结构化、规范驱动的方法的过程。作者发现,详细且维护良好的规范极大地提高了代码质量,并减少了不断重新提示和调试的需求。
认识到上下文窗口和会话稳定性的局限性,作者拥抱详细的文档记录——特别是编写健全的PRD和TRD。这促成了Acai.sh的创建,该系统围绕“feature.yaml”规范构建,其中包含编号的“验收标准ID”(ACIDs),并直接链接到代码和测试。
Acai.sh提供CLI、Web仪表盘和API来管理规范、跟踪实施进度并促进审查。该工作流程强调规范优先开发:先编写规范,然后使用代理来实现它,最后基于ACID覆盖率进行审查。
作者承认潜在的缺点——需要规范纪律,YAML格式的学习曲线——但认为清晰性、可测试性和可维护性的好处超过了成本。最终,Acai.sh旨在将重点从*生成*代码转移到定义*代码应该做什么*,为更可靠和可扩展的AI辅助开发铺平道路。
## AI 编程竞赛:词语宝石谜题结果
Rohana Rezel 的 AI 编程竞赛最新挑战——词语宝石谜题(一种滑动瓦片字母游戏)产生了令人惊讶的结果。**Kimi K2.6**,来自 Moonshot AI 的开源权重模型,以 22 分的绝对优势获胜,击败了像 GPT-5.5(第三名)和 Claude Opus 4.7(第五名)等成熟模型。**MiMo V2-Pro** 来自小米,位居第二。
该谜题涉及通过滑动瓦片在网格上形成单词,评分偏向于较长的单词,并惩罚较短的单词。Kimi K2.6 采用了一种“贪婪”的滑动策略,不懈地尝试解锁新单词,而 MiMo V2-Pro 则专注于识别和获取现有的长单词。
更大的网格尺寸(30x30)被证明至关重要,有利于能够通过滑动*创造*单词,而不是仅仅*寻找*单词的模型。 许多西方模型在这一点上遇到了困难,**Muse** 的表现尤其糟糕,因为它声称所有单词,无论长短,并因此产生巨大的负分。
结果表明,领先的西方模型与新兴的开源权重替代方案(如 Kimi)之间的差距正在缩小,在人工智能分析智能指数上的得分相差几分。 这种转变表明人工智能能力领域的竞争格局正在发生变化,功能越来越强大的模型正变得越来越容易获得。
## 2026年全球联盟的转变
截至2026年,全球地缘政治格局呈现出此前备受吹捧的替代联盟日渐衰弱,以及对特朗普总统领导下的美国政策的重新关注。特朗普正在考虑退出北约——这一举动在法律上因最近国会立法而变得复杂,但上海合作组织(SCO)和金砖国家(BRICS)等组织却证明效率低下。
上海合作组织虽然拥有十个成员国,但受到内部不信任和一项无法执行的互助安全条款的阻碍,尤其是在涉及伊朗的持续冲突方面。金砖国家旨在挑战美元的主导地位,但未能建立可行的替代贸易融资体系或货币,而中国自身的货币正在贬值。这反而加强了美元在全球贸易中的地位。
与此同时,特朗普还在重新评估联合国的角色,削减其资金和影响力,部分原因是作为对中国在该组织内的政治运作的反制。这导致人们对联合国及其附属机构(如国际刑事法院和世界贸易组织)的信任度下降,预示着贸易可能转向双边模式,并远离“基于规则的世界秩序”。
一份最近发布的、由特朗普总统行政命令成立、旨在消除反基督教偏见的500页司法部报告,指控拜登政府期间存在歧视基督徒的模式。该报告详细说明了超过17个联邦机构据称如何监视、调查和施压于基督教团体,引用了例如一份被撤回的2023年FBI备忘录,该备忘录针对“激进传统主义”天主教徒,以及拜登时代关于堕胎、性别和性取向的法规。
司法部特别工作组,由代理司法部长托德·布兰奇领导,声称前政府不成比例地起诉亲生命活动家,并忽视宗教自由,可能为了达到目的而错误解读最高法院的裁决。这延续了之前的一份报告,批评对FACE法案的不均衡执行,偏袒支持堕胎的团体。
各方反应不一。像安德烈亚·皮奇奥蒂-拜尔这样的支持者认为这是对宪法权利侵犯的必要承认,而像跨信仰联盟这样的团体则谴责这是一种“政治噱头”,旨在宣传关于基督教迫害的虚假叙事。前联邦检察官尼玛·拉赫马尼指出政策发生了变化,但尚未观察到对任何宗教团体的系统性偏见。
作者反思了充满未来憧憬的童年——飞行汽车和有用的机器人——与今天技术的现实之间的对比。虽然存在进步,例如智能手机和人工智能,但它们往往未能实现承诺的便利,反而带来了新的复杂性:无休止的密码、堵塞人行的送货机器人,以及转移而非消除的工作。
具体而言,作者强烈不喜欢像Coco和Serve Robotics这样的送货机器人,认为它们更具阻碍性而非帮助。尽管支持者吹捧它们的环保效益,但作者回忆起令人沮丧的遭遇,并指出城市开始对其进行监管或禁止,这与电动自行车和滑板车遇到的问题相似。
最终,作者认为,高科技未来并非想象中的无缝乌托邦,而是一个充满权衡的复杂环境。这些机器人象征着更大的担忧:人类工人可能失业,以及随着技术的日益普及而产生的隐隐的不安感,即使目前其能力有限。
全球军事支出在2025年飙升至创纪录的2.6万亿美元,其中排名前15位的国家贡献了超过2万亿美元——这是首次出现的情况。美国以9210亿美元的预算遥遥领先,超过了接下来八个最高支出国的总和。
中国紧随其后,以2513亿美元成为第二大军费国,进一步巩固了其在亚洲军事支出的主导地位。俄罗斯的预算达到1862亿美元,大幅增长,但预计2026年将下降。
值得注意的是,欧洲的国防支出正在经历大幅增长,这受到乌克兰战争和履行北约承诺(到2035年达到GDP的3.5%)的压力所驱动。德国和英国正在引领这一扩张,两国均大幅增加了预算。这是冷战以来欧洲最大规模的国防建设,标志着地缘政治优先事项的重大转变,并使国防成为全球增长最快的支出类别。
阿拉斯加州长迈克·邓利维于4月30日否决了参议院法案64,该法案是一项获得两党支持的重大选举改革法案。邓利维给出的理由是,即将举行的全州选举给选举司带来了“重大的运营负担”,尽管该法案的制定历时十年。
该法案旨在改善缺席选民的选票追踪,扩大可接受的选民身份证明,修改选民登记册维护,并设立农村社区联络员。然而,州长对在11月选举前安全地实施扩展的选票追踪和错误纠正的可行性表示担忧,这呼应了选举司的警告。
立法者表示失望,认为该法案解决了阿拉斯加广阔偏远地区的投票独特挑战,甚至包括收紧选民身份证明要求的条款——这是否决的一个争议点。立法机构保留以后推翻否决的选项。
中国汽车制造商已经开始影响美国市场,尽管持续存在政治努力限制其准入。比亚迪、吉利和长城汽车等公司正在墨西哥迅速扩张,提供功能丰富、价格实惠的车辆——通常比美国二手车更便宜——并且方便边境附近的消费者购买。
尽管目前通过拟议关税和安全审查限制大规模直接进口,但中国汽车正通过合作、共享平台和个人进口进入美国。这使得“禁令”的说法变得复杂。
重要的是,这些汽车制造商正通过专注于可负担性和速度来获得全球影响力,而美国制造商在应对价格上涨方面面临挑战。这种价格差距创造了美国买家的需求,他们被新车市场排除在外,这对国内汽车制造商构成威胁,并引发了关于数据安全和供应链问题的政策辩论。 这种情况凸显了市场现实的转变,即使华盛顿试图控制它。