Подтвердить что ты не робот

Есть ли какая-либо утилита командной строки GNU/Linux, которая преобразует файлы .doc(x) в .pdf?

Конечно, я 100-й пользователь, который спрашивает об этом, но после того, как я просмотрел похожие темы здесь и на других сайтах, я все еще не могу найти то, что мне нужно. Мне нравится иметь простой инструмент командной строки для моего GNU/Linux, который преобразует файлы .doc(x) в .pdf, но результат выглядит так же, как и оригинал. Поэтому Libre Office не подходит для этого, потому что в некоторых случаях он не конвертируется. Я нашел веб-сайт http://www.freepdfconvert.com/, который хорошо работает, но я не могу загрузить там какие-либо чувствительные файлы, так как это большой риск. Я не говорю, что они будут делать с ними что-нибудь плохое, но это так. Если я не найду никакого хорошего инструмента, возможно, мне придется написать один сам.

4b9b3361

Ответ 1

К сожалению, для Word (doc/docx) в PDF нет гарантированных 1-в-1 конвертеров на базе Linux. Это связано с тем, что Word, продукт Microsoft, использует собственный формат, который немного меняется с каждой версией. Поскольку он не является официально документированным форматом, и Microsoft не переносит Word/Office в Linux (и никогда не будет), вы должны полагаться на обратные инженерные сторонние инструменты.

Мы обнаружили, что лучшим решением с открытым исходным кодом является LibreOffice (который был раздвоен с OpenOffice.org, который сам назывался Star Office до того, как он был открытым источником). Он гораздо более активно развивается, чем AbiWord, как предложил другой ответ.

Использование из командной строки прост и хорошо документировано с большим количеством примеров:

soffice --headless --convert-to pdf filename.doc

Или также вы можете использовать libreoffice вместо soffice в новых версиях.

Ответ 2

Существует также Pandoc.

Pandoc, в основном известный своей Markdown -возможностью обработки (для вывода HTML, LaTeX, PDF, EPUB а что - нет) в последние месяцы приобрела достаточно эффективную возможность обрабатывать входные файлы DOCX.
(ПРИМЕЧАНИЕ: Pandoc работает только для DOCX, а не для файлов DOC.)

Для работы PDF файла требуется рабочая установка LaTeX (с включенными или всеми pdflatex, lualatex и xelatex). В этом случае должна работать следующая простая команда:

pandoc -o output.pdf -f docx input.docx

Обратите внимание, однако, что макет вывода и стили шрифтов теперь не будут выглядеть похожими на то, что будет выглядеть, если вы экспортируете DOCX из Word в PDF. Он будет использовать стили документа LaTeX по умолчанию.

Вы можете влиять на стиль вывода PDF файла, созданного в LaTeX, используя специальный файл шаблона, подобный этому...

pandoc                              \
  -o output.pdf                     \
  -f docx                           \
 --template=my-latex-template.tmplt \
   input.docx

... но это больше подходит для экспертов Pandoc/LaTeX, чем для новичков.

Ответ 3

Я никогда не делал этого раньше, но я искал googled, и я нашел этот видеоурок:

http://www.youtube.com/watch?v=RzxwJAeFMSc

Он использует приложение под названием AbiWord.

EDIT: Извините, если мой ответ не ответил на ваш вопрос, на этом сайте есть много сообщений, чтобы преобразовать документ в pdf, но я не знал, есть ли 1:1. Я уверен, что вы можете сделать свое приложение. Я рекомендую вам начать здесь: .doc в pdf с помощью python.