Ornith-1.0 是一个专为智能体编码任务优化的全新开源模型系列,涵盖了从 9B 参数的轻量化边缘部署单元到 397B 参数的前沿规模模型。该系列基于 Gemma 4 和 Qwen 3.5 构建,在 SWE-Bench Verified 和 Terminal-Bench 2.1 等主流基准测试中表现出色,其中 397B 版本足以媲美 Claude Opus 4.7。 Ornith-1.0 的突破性在于其自我完善的训练框架。模型不再依赖人工编写的代码工具,而是同步进化其问题解决策略以及引导任务的特定“框架”(编排逻辑)。通过强化学习,模型能够不断优化这些框架,从而引导出更高奖励的搜索路径。 为防止奖励破解,该框架采用了三层防御机制:不可变的运行环境边界、确定性的工具使用监控,以及作为否决权执行者的冻结 LLM 评判员。此外,模型通过采用带有滞后标记加权的流水线强化学习策略,有效处理了长时、异步的训练回放。这种方法使 Ornith-1.0 能够在无需人工干预的情况下,实现高质量、自动化的编码策略,并持续自我提升,从而在各种设备规模下提供强大且高效的性能。
特朗普政府正通过积极运用旨在针对所谓“反法西斯”行动者的反恐备忘录(NSPM-7),升级对异见人士的打压。这一策略在近期“草原地带”(Prairieland)案中八名被告被判处总计450年监禁的事件中表现得尤为明显。值得注意的是,丹尼尔·“德斯”·桑切斯·埃斯特拉达(Daniel "Des" Sanchez Estrada)因运送政治宣传册而被判处30年监禁。这一判决基于政府的一种理论,即持有“极端”文学作品意味着要为持有相似意识形态的其他人的罪行承担共犯责任。
批评人士认为,这代表了对美国宪法第一修正案的危险侵蚀,即意识形态的认同正日益被与犯罪企业混为一谈。通过将持有和分享不受欢迎的信息定为犯罪,政府正为美国人制造一种“第22条军规”式的困境:接触有争议的思想会招致调查,而试图隐瞒这些信仰的证据又可能导致因妨碍司法而被起诉。
随着美国司法部暗示“草原地带”案仅仅是一个开始,政府将政治对手和媒体贴上“内部敌人”标签的言论表明,其打击范围正在扩大。这威胁到受保护的言论和政治表达,正将国家推向一个独立思考被视为违禁品的未来。