Подтвердить что ты не робот

Можно ли распаковать PDF с помощью Adobe Acrobat или Acrobat Distiller?

Большинство файлов PDF, найденных в Интернете, имеют сжатые и нечитаемые потоки данных. Можно ли разжать внутреннее содержимое файла PDF с помощью Acrobat или Acrobat Distiller, что позволяет нам читать исходный код с помощью текстового редактора?

P.S. Этот вопрос вдохновлен этим ответом, в котором объясняется, как это можно сделать с GhostScript.

4b9b3361

Ответ 1

Это легко с qpdf и pdftk.

С Adobe Acrobat вы можете получить внутреннюю структуру после профилирования PDF (предваритесь с некоторым профилем (например, обнаружите ошибки синтаксиса PDF), затем Options- > Internal PDF structure) - но нет способа получить что-то редактируемое с текстом редактор.

Ответ 2

Используйте cpdf:

cpdf -decompress in.pdf -o out.pdf

а затем графические операторы для каждой страницы могут быть прочитаны в текстовом редакторе. Однако вам понадобится копия стандарта в качестве ссылки.

Раскрытие информации: Я являюсь автором cpdf.

Ответ 3

qpdf и pdftk уже упомянуты. Чтобы показать команды:

$ qpdf --qdf --object-streams=disable orig.pdf uncompressed-orig.pdf
$ pdftk orig.pdf output uncompressed-orig.pdf uncompress

mutool, однако еще не упоминался:

$ mutool clean -d -a orig.pdf uncompressed-orig.pdf

mutool - инструмент командной строки, который поставляется вместе с облегченным средством просмотра документов PDF + PDF.

Я не думаю, что вы можете добиться разжатия потоков объектов PDF с помощью Acrobat или Distiller (если у вас нет дополнительных плагинов плагинов).