Вы сканируете стопку бумаг и получаете PDF. Но попробуйте найти слово — ничего. Потому что отсканированные PDF — по сути изображения в контейнере PDF.

Что делает OCR

OCR анализирует изображения, распознаёт буквы и слова и создаёт невидимый текстовый слой. PDF выглядит так же, но теперь можно искать и копировать текст.

Пакетный OCR с DocInspector

Перетащите папку PDF в DocInspector, выберите OCR и запустите обработку. Оригиналы сохраняются.

Когда это нужно

  • Оцифровка бумажных архивов
  • Юридические документы с поиском
  • Обработка отсканированных счетов
  • Конвертация факсов в PDF с поиском