Насколько я знаю, Tesseract 3.x поставляется с 6 английскими (исправить меня, если я ошибаюсь) шрифтами. Мне нужно тренировать Tesseract для более 5 типов шрифтов. Мне нужны только заглавные буквы и цифры (никаких специальных символов или символов).
Я следил за различными процессами, например: Добавление новых шрифтов в Tesseract 3 OCR Engine
а также используемые инструменты для автоматизации процесса, например Тренер Serak Tesseract для Tesseract 3.02
Для создания файлов я использовал QT Box Editor
После использования вышеперечисленных инструментов я получаю файл eng.traineddata
. Все учебные пособия говорят мне добавить этот файл eng.traineddata
в папку Tesseract-OCR\tessdata
, но при этом он заменит исходный файл eng.traineddata
. После этого я потеряю шрифты по умолчанию, которые поставляются с Tesseract 3.x?
Как добавить новые шрифты? Мне все еще не ясно. Надеюсь, кто-то может мне помочь. Спасибо.