## 塔里克·杰米森的悲剧 & 可待因安全
像可待因这样的阿片类药物会抑制呼吸,不幸的是,看似安全的剂量对婴儿塔里克·杰米森来说却是致命的。他的母亲拉尼被处方可待因来缓解产后疼痛,却不知不觉地通过母乳传递了致命的剂量。 领先的儿科医生和毒理学家吉迪恩·科伦进行了调查,发现拉尼拥有罕见的遗传特征——多了一份基因拷贝,导致她的肝脏迅速将可待因转化为高浓度的吗啡。
塔里克的吗啡水平非常高,超过了安全呼吸的阈值。 科伦随后发表在《柳叶刀》上的研究表明,高达40%的哺乳期母亲可能像拉尼一样是“超快速代谢者”,从而使她们的婴儿面临风险。这一发现促使卫生监管部门迅速采取行动,在可待因包装上发出警告,并转向开具替代止痛药。
杰米森一家对制药公司提起了集体诉讼,旨在防止类似的悲剧发生。 尽管失去塔里克的痛苦依然存在,但他们的案件促使阿片类药物安全指南发生了关键变化,强调了基因检测和个性化医疗在产后护理中的重要性。 科伦继续倡导提高认识,强调未检测到的可待因毒性可能是婴儿死亡的潜在原因。
## Trinity-Large:开源AI新前沿
经过两个月的密集开发,团队发布了Trinity-Large,一个400B参数的稀疏混合专家(MoE)模型,以及两个附加变体:Trinity-Large-Base(真正的基础模型)和Trinity-Large-Preview(即用型聊天模型)。该项目耗资约2000万美元,代表着在可访问、高性能AI方面迈出了重要一步。
Trinity-Large拥有独特的架构,具有高稀疏性(1.56%的激活参数),能够实现更快、更高效的训练和推理——比同类模型快大约2-3倍。它在17T个策划数据上进行训练,在数学、编码和推理等领域实现了前沿水平的性能,匹配或超越了现有的开源模型。
发布的*Preview*版本优先考虑在创意任务和代理应用中的实用性,而*Base*模型则为研究人员提供了一个干净的检查点,用于研究预训练的影响。团队利用了基于动量的专家负载均衡和z-loss等创新技术来稳定训练。Trinity-Large-Preview目前在OpenRouter上免费提供,计划进行完全发布和进一步改进。此次发布旨在赋予开源社区一个强大、可拥有且处于前沿水平的模型。
## 构建人工智能体验:以人为本的旅行图像方法
挑战:如何将用户自由形式的旅行查询(例如“sfo-jfk”)转化为旅行规划应用程序(Stardrift)中精美且相关的图像? 仅仅通过人工智能生成图像被证明质量低且成本高昂,而谷歌搜索则存在版权问题风险。
解决方案结合了大型语言模型、传统软件工程,以及至关重要的*人工策划*。 系统分为三个步骤:首先,大型语言模型识别查询中的“地点”,并为每个地点定义名称和类型(城市、地区、国家)。 其次,数据库将这些“地点”映射到从Unsplash获取的策划照片。 最后,软件检索适当的图像,即使对于未识别的地点,也会使用地理定位来查找最近的已映射地点。
填充数据库是一个手动但令人愉悦的过程。 虽然该系统并非完美——存在差距,并且图像选择反映了个人品味——但它展示了一个强大的原则:利用人工智能的优势,并辅以人类专业知识。 这种方法可以产生更精致、更“品味”的人工智能体验,避免完全依赖自动化解决方案的陷阱。 该系统还包括缺失地点提醒,允许通过手动补全进行持续改进。
## JFMM.net:改进大型手册的搜索
作者在海军服役期间,对3470页《联合舰队维护手册》(JFMM)缓慢而繁琐的搜索过程感到沮丧,因此构建了[JFMM.net](https://jfmm.net/)——一个语义搜索引擎,旨在改善对这些关键信息的访问。传统的文本搜索效果不佳,需要精确的词语匹配,并且在政府笔记本电脑上每次查询需要超过一分钟。
最初的版本使用了向量相似性搜索,使用`nomic-embed-text-v1.5`嵌入文本块,并将其存储在云托管的Postgres数据库中,使用`PGVector`。虽然功能可用,但成本很高。重写侧重于经济性和相关性。
作者切换到带有`sqlite-vec`扩展的轻量级SQLite数据库,从而能够在本地嵌入整个手册并部署更小的容器。量化,将模型精度降低到8位,进一步减少了RAM的使用。为了提高结果准确性,添加了一个重排序模型(`BAAI/bge-reranker-v2-m3`),尽管这会略微增加延迟。实施了HATEOAS分页方法,利用URL管理状态并提高效率。
结果是一个更相关、更便宜、更方便开发者的搜索工具,现在每月成本低于2美元,但由于重排序,查询速度略有下降。