Вы сканируете стопку бумаг и получаете PDF. Но попробуйте найти слово — ничего. Потому что отсканированные PDF — по сути изображения в контейнере PDF.
Что делает OCR
OCR анализирует изображения, распознаёт буквы и слова и создаёт невидимый текстовый слой. PDF выглядит так же, но теперь можно искать и копировать текст.
Пакетный OCR с DocInspector
Перетащите папку PDF в DocInspector, выберите OCR и запустите обработку. Оригиналы сохраняются.
Когда это нужно
- Оцифровка бумажных архивов
- Юридические документы с поиском
- Обработка отсканированных счетов
- Конвертация факсов в PDF с поиском