Используйте PDF.js для статического преобразования PDF в HTML - программирование
Подтвердить что ты не робот

Используйте PDF.js для статического преобразования PDF в HTML

PDF.js - это последняя библиотека из Mozilla и представляет собой рендеринг PDF на основе стандартов, который полностью написан в Javascript. В настоящее время вы не можете получить доступ к сгенерированному HTML, и библиотека может использоваться только как средство просмотра. Можно ли использовать PDF.js для статического преобразования PDF в его эквивалент HTML? Учитывая, что он отображается в браузере, он должен быть HTML + CSS, а JS будет использоваться только для навигации.

После преобразования в HTML я планирую использовать наш существующий рабочий процесс HTML, чтобы импортировать/индексировать/потреблять страницу, как если бы это была обычная веб-страница HTML.

4b9b3361

Ответ 1

Примечание: это касается первоначального вопроса, а также для других, которые могут посещать это для соответствующей помощи, как это было со мной.;)

Ответ:
Вы можете попробовать: Poppler или pdf2htmlEX, который основан на Poppler.

Я бы порекомендовал посмотреть pdf2htmlEX документацию, а также в качестве таблицы сравнения .

Ответ 2

pdf.js отображает Canvas, поэтому его нельзя использовать для статического преобразования PDF в HTML

Ответ 3

AccuSoft имеет HTML5-основанное средство просмотра PDF/DOC, называемое Prizm. Я не думаю, что это может преобразовать PDF статически в HTML, но он выглядит как функциональный просмотрщик на основе HTML5. У меня нет опыта в этом, но онлайн-демонстрация HTML5 (ссылка) выглядит довольно впечатляюще. Они утверждают, что могут использоваться на ПК и мобильных устройствах для отличного отображения таких файлов.

Технология просмотра Accusoft HTML5 может отображать практически любой файл документа - DOC, PDF, PPT, CAD и еще десятки - через собственный браузер практически на любом смартфоне или планшете без каких-либо дополнительных приложений или игроков, требуемых для пользовательских устройств.

Ответ 4

DocPub работает от PDFNet, PDF SDK с поддержкой С#, который поддерживает преобразование PDF в HTML в автономном режиме.

WebViewer из той же компании - это средство просмотра PDF на основе HTML5, которое в браузере делает документы "на лету".

WebViewer работает со всеми основными веб-платформами; зритель может быть непосредственно встроен и настроен в любом приложении HTML5, Silverlight или Flash. Содержимое может быть мгновенно доступно из любой системы или устройства, включая iPad/iPhone (iOS), Android, Windows (настольные и планшеты), WP8, Linux, Mac и т.д. - демонстрационная