PDF.js - это последняя библиотека из Mozilla и представляет собой рендеринг PDF на основе стандартов, который полностью написан в Javascript. В настоящее время вы не можете получить доступ к сгенерированному HTML, и библиотека может использоваться только как средство просмотра. Можно ли использовать PDF.js для статического преобразования PDF в его эквивалент HTML? Учитывая, что он отображается в браузере, он должен быть HTML + CSS, а JS будет использоваться только для навигации.
После преобразования в HTML я планирую использовать наш существующий рабочий процесс HTML, чтобы импортировать/индексировать/потреблять страницу, как если бы это была обычная веб-страница HTML.