Show HN:Wordllama – 您可以使用 LLM 的代币嵌入做的事情
Show HN: Wordllama – Things you can do with the token embeddings of an LLM

原始链接: https://github.com/dleemiller/WordLlama

此提交不属于此存储库上的任何分支,并且可能属于存储库外部的分支。 您目前无法执行该操作。

用户创建了一个轻量级自然语言处理 (NLP) 库,该库使用从大型语言模型 (LLM) 平均得到的标记嵌入,而不需要 PyTorch 等复杂的深度学习基础设施。 该模型的设计包括提取标记嵌入、连接它们、减少它们的维度,以及使用句子转换器框架和数据集对其进行训练。 该模型的一个显着特点是它能够进行排名、过滤、聚类、去重和计算相似度。 这些功能既有标准的余弦相似度,也有更快、内存效率更高的二进制版本。 该库还旨在通过 pip 实现速度、紧凑性和易于安装。 虽然无法与 Transformer 模型相比,但该库在平均文本嵌入基准 (MTEB) 上表现良好,特别是在性能和​​大小方面与其他词嵌入模型相比。 目前,该库支持 Linux 和 macOS 系统,但 Windows 支持仍在开发中。
相关文章

原文
联系我们 contact @ memedata.com