Я потратил немного времени на это, и лучшим решением, которое я нашел, было установить unoconv на сервере и использовать PHP для взаимодействия с ним через системные вызовы.
Я бы с удовольствием нашел для этого хорошее родное PHP-решение, но, к сожалению, не смог.
Edit
Поскольку изначально ответив на это, я столкнулся с веб-сервисом, который представляет API для преобразования документов. Я не тестировал его очень тщательно, но он, похоже, приносит достойные результаты при преобразовании Word в HTML: CloudConvert.
Ответ 2
Попробуйте PHPWord lib. Согласно сайту, он основан на PHPExcel Lib, который отлично читает/пишет excelsheets.
Ответ 3
PHPDocx имеет решение. Согласно сайту вы можете извлекать данные непосредственно из любой базы данных или электронной таблицы и экспортировать их в другие популярные форматы (PDF, DOC, HTML, ODT,...) с помощью плагина преобразования. Эти отчеты могут включать редактируемые графики (только docx), изображения, таблицы, заголовки, нижние колонтитулы и т.д.
Не уверен, насколько хорошо он может преобразовать слово в html
Ответ 4
Лучшее решение, которое я нашел до сих пор, http://www.phplivedocx.org/. Вы используете его с картой Zend.
Очень легко настроить и получить минимальное отклонение от фактического формата слова. Он отлично конвертирует слова docs в html.