一种名为“Sidewinder”的新型DNA合成方法,有望填补人工智能驱动的基因组设计与物理构建之间的鸿沟。虽然像Evo 2这样的生成式人工智能工具现在可以高速设计复杂的基因序列,但实验室的组装过程仍然是缓慢、昂贵且容易出错的瓶颈。
Sidewinder由加州理工学院的王开航(音译,Kaihang Wang)团队开发,使科学家能够以史无前例的精度同时组装多个基因序列。通过在DNA片段上使用独特的分子“条形码”(类似于手稿中的页码),该方法确保了片段能与预期的配对,几乎消除了组装错误。包括自动生成条形码的软件以及使用高性价比原材料在内的多项最新创新,使研究人员能够在几天(而非几个月)内构建出漫长且复杂的DNA结构。
合成生物学的这一“阶跃式变化”加速了用于药物、燃料和化学品生产的工程微生物的开发。研究人员已共同创立了一家名为Genyro的公司将该技术商业化,但他们同时也计划让学术界能够继续使用该平台,这可能为组装完整的合成基因组铺平道路。
本项目探索了如何将 Raspberry Pi Pico (RP2350) 与 Z80 CPU 接口,以监测并交互其地址总线和数据总线。作者利用一块定制的转接 PCB,将 RP2350 的 GPIO 引脚连接至 Z80 的 16 位地址总线、8 位数据总线,以及关键的控制线路(如 /RD、/WR、/IORQ 等)。
核心重点在于理解 Z80 的总线时序,特别是确保同步所需的时钟要求。作者利用 RP2350 的高速 GPIO 能力对 Z80 总线进行轮询,通过仿真离散 TTL 逻辑芯片来实现数据捕获。通过 RC2014 计算机执行 I/O 写入的演示,验证了该方案的可行性——RP2350 能够检测到写入操作并更新本地 LED 显示。
虽然目前仅在单核心上使用了简单的非同步轮询,但作者计划将其升级为更稳健的接口。未来的目标包括实现双向 I/O、内存映射设备仿真,以及利用 RP2350 的 PIO(可编程 I/O)模块进行自主总线管理,这可能使 RP2350 能够控制 Z80 时钟,从而实现精确的指令级单步调试。
作者探讨了“本地优先”人工智能的可行性,通过微调开源大语言模型(Llama 3.1 8B 和 Qwen 2.5 7B),使其能够模仿 20 世纪 90 年代微软技术文档的写作风格。
作者使用了来自“Bitsavers”档案库中超过 3700 万字的语料,在清洗数据后,通过云端 GPU 运用 QLoRA(量化低秩适应)技术创建了专用适配器。这一过程使模型能够掌握独特的、符合时代特征的技术语调,从而将 90 年代的文档结构成功应用于现代或虚构的概念中。
实验表明,微调是一种有效且经济的方式,能够赋予模型特定的文体“声音”或内部写作标准。然而,作者强调这并非万能方案:它需要高质量的数据整理、对训练参数(如秩和轮次)的严谨管理,以及在模型表达力和事实可靠性之间取得平衡。最终,作者总结认为,尽管这些经过微调的模型在模仿方面表现出色,并能有效辅助作家的工作流程,但它们仍缺乏取代技术写作者所需的人类判断力。