Подтвердить что ты не робот

Есть ли способ улучшить Tesseract OCR с помощью небольших шрифтов?

Я пытаюсь использовать tesseract-OCR через python-tesseract для чтения шрифта с низким разрешением, который выглядит так:

enter image description here

К сожалению, это изображение возвращает

ZIJZHZI

Я думаю, что разрешение слишком низкое, и это вызывает проблемы. Я пробовал увеличивать изображение и обрезать его до отдельных символов, но ни один из них не обеспечивает значительного улучшения. Есть ли что-нибудь еще, что я должен рассмотреть, желательно что-то, что можно было бы сделать с помощью библиотеки изображений Python? Или я должен просто отказаться от tesseract/train.

Для чего стоит, PIL имеет следующие встроенные фильтры:

BLUR, CONTOUR, DETAIL, EDGE_ENHANCE,
EDGE_ENHANCE_MORE, EMBOSS, FIND_EDGES,
SMOOTH, SMOOTH_MORE и SHARPEN

4b9b3361

Ответ 1

Я попытался увеличить изображение с помощью

  convert -resize 400% in.bmp out.bmp

И затем прочитайте его:

  tesseract out.bmp res

Результат правильный:

  100