## 牛奶的惊人复杂世界 一次简单的乳制品区购物之旅,引发了对牛奶从牛到包装盒的整个过程的深入探索。这一切始于现代奶牛惊人的产量——一瓶牛奶可以在一小时内生产出来!但真正的惊喜不是牛奶的*数量*,而是它*变成*的东西。 牛奶不仅仅是一种饮料,它还是几十种产品的极具适应性的基础。通过分离、巴氏杀菌、均质化和发酵等工艺,牛奶可以衍生出奶油、黄油、酸奶以及超过2000种奶酪。每一步都利用了牛奶独特的性质——它的乳液、胶体和溶液特性——来创造出截然不同的结果。 除了食品,牛奶成分如酪蛋白还被用于令人惊讶的应用中,从耐用的油漆和二战时期的飞机胶水到塑料,甚至药物填充剂。有趣的是,奶酪的制作历史早于人类消化乳糖的能力,这展示了古代克服生物限制的聪明才智。全球乳业是一个庞大的8000亿至9000亿美元的市场,其驱动力是这种单一白色液体的惊人适应性。
## 编码代理通过研究增强:LLM 推理速度提升 15%
这项研究表明,在代码修改*之前*配备研究阶段的编码代理可以显著改善优化结果。研究人员通过文献综述和竞争对手分析增强了一个自动研究循环(类似于 Karpathy 的工作),并将其应用于 llama.cpp 项目,使用 SkyPilot 进行并行云端执行(4 台虚拟机,总成本约 29 美元)。
该代理的任务是加速 TinyLlama 1.1B 的 CPU 推理,通过五项关键优化,在 x86 架构上实现了 **+15% 的速度提升,在 ARM 架构上实现了 +5% 的速度提升**。这些优化包括融合 softmax、RMS norm 和 flash attention 的 KQ tile 等操作——这些策略是通过研究现有的 CUDA/Metal 实现和 ik_llama.cpp 分支而识别出来的,而不仅仅是从代码库本身中获取。
该研究强调,当解决方案存在于现有源代码之外时,仅靠代码的方法会遇到困难。虽然之前的自动研究成功地优化了具有可见优化表面的项目(如 Liquid),但 llama.cpp 需要外部知识来识别内存带宽瓶颈和有效的融合策略。研究阶段比单纯搜索 arXiv 更有成效。完整的设置是公开可用的,可以应用于其他可基准测试的项目。