Я работаю над приложением для обработки образов документов (в основном, счетов-фактур) и в основном, я хотел бы преобразовать определенные области интереса в XML-структуру, а затем классифицировать документ на основе этих данных. В настоящее время я использую ImageJ для анализа изображения документа и Asprise/tesseract для OCR.
Теперь я ищу что-то, чтобы сделать разработку проще. В частности, я ищу что-то, чтобы автоматически сопоставить образ документа и проанализировать структуру документа (например, преобразование изображения в структуру квадрантов для упрощения обработки). Хотя я предпочитаю Java и ImageJ, меня интересуют любые библиотеки/код/документы, независимо от языка программирования, на котором он написан.
В то время как система, над которой я работаю, должна, насколько это возможно, автоматически обрабатывать данные, пользователь должен контролировать результаты и, при необходимости, корректировать классификацию, предложенную системой. Поэтому я заинтересован в использовании методов машинного обучения для достижения более надежных результатов. Когда подобные документы обрабатываются, например, счета-фактуры конкретной компании, ее структура обычно одинакова. Когда пользователь ранее исправил данные документов у компании, эти исправления должны быть рассмотрены в будущем. Я имею только ограниченное знание методов машинного обучения и хотел бы знать, как я мог реализовать свою идею.