PDF повсюду — настолько обычны, что мы принимаем их как должное. Но в этом формате скрыто больше, чем кажется.
1. PDF может содержать исполняемый код
Да, серьёзно. PDF может включать JavaScript, который запускается при открытии файла. Хотя большинство просмотрщиков изолируют этот код, он использовался для доставки вредоносного ПО. То «невинное» PDF-вложение в email? Оно может запустить код на вашем компьютере.
2. «Удалённый» текст может всё ещё быть на месте
Когда вы используете чёрный прямоугольник для «редактирования» текста в PDF, оригинальный текст часто остаётся в файле — просто скрыт за прямоугольником. Любой с базовым PDF-редактором может убрать прямоугольник и прочитать всё. Правильное редактирование требует фактического удаления данных.
3. PDF может быть больше 10 ГБ
Спецификация PDF допускает файлы до 10 ГБ. Инженерные фирмы регулярно работают с многогигабайтными PDF с детальными чертежами. DocInspector обрабатывает такие файлы потоково.
4. Каждый PDF имеет отпечаток создания
Откройте свойства любого PDF и найдёте точное ПО, создавшее его, дату создания, даты изменений и часто имя автора. Эти метаданные сохраняются через пересылку email, облачный обмен и копирование.
5. Один повреждённый байт может сделать PDF нечитаемым
PDF опирается на таблицу перекрёстных ссылок в конце файла. Если эта таблица повреждена, весь файл становится нечитаемым — даже если 99,99% данных целы. Модуль восстановления DocInspector перестраивает эту таблицу с нуля, восстанавливая «мёртвые» файлы.