У меня проблема с запуском tesseract-ocr engine на linux. Я загрузил данные языка RUS и поместил их в каталог tessdata (/usr/local/share/tessdata). Когда я пытаюсь запустить tesseract с помощью команды tesseract blob.jpg out -l rus
, появляется сообщение об ошибке:
Error opening data file /usr/local/share/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language eng
Tesseract couldn't load any languages!
Could not initialize tesseract.
В соответствии с инструкцией по компиляции я использовал export TESSDATA_PREFIX='/usr/local/share/'
для указания моего каталога tessdata.
Может быть, я должен отредактировать любые файлы конфигурации? Tesseract пытается загрузить файлы данных 'eng' вместо 'rus'.
Снимок экрана: http://i.stack.imgur.com/I0Guc.png