Я хочу разработать приложение для чтения электронных книг. Какие хорошие библиотеки доступны для разбора форматов, таких как .azw,.mobi,.pdf и т.д.?
EBook parser (.azw,.mobi, epub)?
Ответ 1
Как сказал Ранхиру, here и здесь вы можете увидеть, как анализируются PDF файлы.
Однако для .mobi
нет библиотеки, поэтому вам придется самостоятельно разбирать формат. Полную спецификацию формата можно прочитать на вики-странице mobileread.
С .azw
файлами он отличается: если книга Kindle не имеет DRM, тогда ее формат совпадает с .mobi
, т.е. они абсолютно взаимозаменяемы. В противном случае это очень сложно сделать, так как вам также придется генерировать PID Kindle и выполнять де-DRM-ввод файла .azw
. Там есть руководство о том, как это сделать на рабочем столе здесь. Тем не менее, он не рекомендуется сильно, так как он нарушает всю точку DRM и является незаконным почти везде.
Ответ 2
Для mobi недоступен полный список спецификаций, но вы должны прямо перейти в формат PDB, который расширен и используется MOBI