Если вы только читаете, простейший использовать команду linux soffice для ее преобразования в текст, а затем загружать текст в python:
Ответ 4
doc (Word 2003 в этом случае) и docx (Word 2007) - это разные форматы, где последний обычно представляет собой архив xml и файлов изображений. Я бы предположил, что очень легко писать файлы docx, манипулируя содержимым этих xml файлов. Однако я не вижу, как вы могли читать и записывать в файл документа без какого-либо интерфейса COM-компонента.