支持结构化精准提取复杂PDF文件内容,教程:https://www.youtube.com/watch?v=XF3Q_ZjwfaI,演示程序:https://olmocr.allenai.org/
基于 PaddlePaddle 的超棒多语言 OCR 工具包(实用的超轻量级 OCR 系统,支持 80+ 语言识别,提供数据标注和合成工具,支持在服务器、移动、嵌入式和 IoT 设备之间训练和部署)
OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。