原文
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
原始链接: https://github.com/VikParuchuri/marker
总而言之,Marker 是一个深度学习模型管道,旨在将 PDF、EPUB 和 MOBI 文档转换为可读的 Markdown 格式,与传统 OCR 工具相比,周转时间更短,整体准确性更高。 使用 Marker 需要配置某些设置,例如选择火炬设备、指定 VRAM_PER_TASK、INFERENCE_RAM、ENABLE_EDITOR_MODEL、MIN_LENGTH,以及在处理多个输入 PDF 时创建 JSON 格式的元数据文件。 速度测试显示标准文本的转换率在 0.3 秒到 0.6 秒之间,而峰值 GPU 内存利用率约为 3.3GB。
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.