Goldziher/kreuzberg: A text extraction library supporting PDFs, images, office documents and more
04-14-2025
Link:
https://github.com/Goldziher/kreuzberg
Note:
Kreuzberg 是一个用于从文档中提取文本的 Python 库。它提供了一个统一的异步接口,可以从 PDF、图像、办公文档等中提取文本。该库专注于本地处理,没有外部 API 调用或云依赖,并且具有轻量级和高性能的特点。
← Back to articles