Show HN:Reor – 一款在本地运行模型的人工智能笔记应用程序
Show HN: Reor – An AI note-taking app that runs models locally

原始链接: https://github.com/reorproject/reor

Reor Project 是一款人工智能驱动的桌面笔记应用程序,使用 Llama.cpp 和 Transformers.js 开发,用于在本地运行模型。 它允许通过向量相似性在相关想法之间自动链接,并提供基于 LLM 的问答功能以及语义搜索。 Reor 项目背后的想法是通过设计使用于思考的人工智能工具能够在本地运行。 用 Reor 编写的每个音符都通过分块和嵌入过程进行处理,这些过程在内部利用矢量数据库,同时使用矢量相似性连接相关音符。 此外,该应用程序通过提供由 LLMS 提供支持的问答功能,有助于从笔记中学习。 最后,该项目旨在通过使人们在撰写或编辑笔记时能够从语料库中“检索”相关想法来增强人们的想法。 总体而言,Reor 致力于为用户提供一个交互式平台,能够以极高的功效实现笔记的交叉引用。 来自各种应用程序的贡献和集成可能会在未来的某个时候变得可用。 Reor 的成立基于这样一种理解:让人工智能系统在本地而不是在云基础设施上运行可以提高能效,同时不会影响数据隐私或安全问题。 但是,它仍然支持连接到公共 API,例如 Oobabooaga、Ollama 或 OpenAI 提供的 API。 此外,用户还可以选择下载预先训练的语言处理模型,他们可以通过 HuggingFace 等方式下载。 如果用户想要导入来自其他应用程序的笔记,则需要使用 Markdown 文档手动填充其目录。 随着开发的进展,其他功能可能会随之而来。 该项目自2022年10月上线以来,因其创新理念而受到欢迎,并在全球范围内得到了贡献。 其主要目标是通过应用机器智能技术,特别是最新的深度学习进展,使学习体验更加智能和高效。 目前该项目仅提供基本功能,但最终计划添加多种类型的高级机器学习训练方法来满足用户的需求。 目前,Reor背后的团队主要致力于提高速度性能,特别是在快速召回、向量化和推理能力方面,旨在提供更快、更准确的搜索结果输出。 未来的路线图目标包括增加对协作式多创作的支持以及支持翻译成不同的语言。 此外,团队不断拓展训练模式和方法

目前,REOR 支持“*.md”、“*_.md”和“*.markdown”文件扩展名,用于在多格式注释页面中输入文本注释或文本部分。 尚不直接支持纯文本文件格式,包括“*.txt”和“*.plain”,尽管从技术上讲可以通过逐字节读取文件来识别段落边界来解析它们。 这种解析器方法可能会导致在识别有效段落和准确确定正确换行符方面的性能不稳定。 因此,REOR 建议将纯文本注释转换为 Markdown 格式,然后再将其输入系统。 或者,在纯文本注释顶部添加 Markdown 标题行(例如“Title”)也可能获得合理的成功率。 此外,如前所述,修改代码库以接受替代输入(例如 PDF 文件)在技术上是可行的,但这需要在典型软件发布周期范围之外进行大量的工程工作。 因此,如果有人真正关心支持纯文本,我们建议针对该存储库提出问题,以引起对该主题的关注。 谢谢你让我们知道! 如果您计划继续使用各种纯文本注释作为系统的输入,请提出描述您的用例的问题(如下所述),我们将考虑实施替代解决方案。 这是一个粗略的假设示例,说明了一个常见问题。 让我们假设一个人主要想使用所提出的系统来从各种学术出版物和参考材料中提取见解。 对于这种情况,大多数传入源仅包含纯文本文档,偶尔会通过缩进段落标识嵌套的小节。 这些来源通常保存为 .pdf,但有时会首先转换为纯文本以消除图像。 因此,将所有纯文本注释转换为 Markdown 即使不是不可能,也可能很麻烦。 为了解决这些问题,我们建议针对我们的存储库提出一个问题,以便我们可以讨论修改代码库以支持更广泛的可接受的输入格式是否可行或可取。 执行此操作时,请提供有关预期用例、预期纯文本输入材料量以及纯文本支持是否会显着改变预期工作流程或以其他方式影响设计理念、架构、可扩展性、可维护性或安全配置文件的详细信息。 整体系统。 此外,还要求进行成本效益分析。 通过提供详细信息,我们希望能够促进重点关注
相关文章

原文
联系我们 contact @ memedata.com