Я работаю над веб-приложением, где пользователи могут загружать файлы Microsoft Office Document. Прямо сейчас наш сервер работает Node.JS с Express.js, и мы размещаемся на Heroku. Из-за этого я не думаю, что могу установить такие программы, как abiword или catdoc. Я могу обрабатывать загрузки файлов, но не могу разобрать содержимое документа.
Как я могу прочитать содержимое файла doc? Затем информация будет помещена в базу данных. Было бы неплохо сохранить базовое форматирование (жирный, курсив, подчеркивание), но не обязательно.