Подтвердить что ты не робот

Использование Tesseract из java

Я пытаюсь создать образец приложения в java, который будет читать файл изображения и просто выводить текст, извлеченный из изображения. Я нашел проект Tesseract, который кажется многообещающим, однако, его в С++. Чтобы использовать его, должен ли я просто запустить его как командную строку из моего java-приложения Runtime.exec(...)? Или есть лучшее решение, возможно, JAR? Кроме того, это всего лишь пример приложения, который будет запускать его в качестве приложения командной строки из-за перспективы масштабируемости?

4b9b3361

Ответ 1

Теперь tesseract предоставляется проектом javacv, это гораздо лучший вариант, чем использование Tess4J, поскольку все, что требуется, - это добавление одной зависимости к вашему pom файлу, тогда собственные библиотеки для вашей платформы будут загружаться и автоматически соединяться для вы по версии javacv tesseract.

Я создал здесь проект maven здесь - https://github.com/piersy/BasicTesseractExample

а также пример gradle здесь - https://github.com/piersy/BasicTesseractExampleGradle

Чтобы это работало на моей машине ubuntu, мне нужно было обновить мою установку libstdС++ 6

Я достиг этого, выполнив следующее, хотя для вас может работать только установка libstdС++ 6.

sudo add-apt-repository ppa:ubuntu-toolchain-r/test 
sudo apt-get update
sudo apt-get install libstdc++6

Обратите внимание, что проект gradle не выполняет автоматическую установку, но все еще намного проще, чем использование Tess4J

Проект javacv находится здесь - https://github.com/bytedeco/javacpp-presets/tree/master/tesseract

Большой реквизит для парней javacv, только жаль, что я не нашел это раньше, так как это спасло бы меня неделю, когда tess4j работал на нескольких платформах!

Ответ 2

Я использовал проект tesseract в своем java-коде. Все, что вам нужно сделать, это

  • Получить tess4j jni wrapper для tesseract.
  • Откройте tess4j proj в своем идее и добавьте исходные пакеты и библиотеки в свои собственные проект.
  • Напишите код, создающий экземпляр для класса tesseract, а затем используйте его для
    выполнение OCR.

Пожалуйста, ознакомьтесь с этим http://tphangout.com/?p=18

Он дает инструкции о том, как создать проект java для чтения изображения и преобразовать его в текст с помощью API-интерфейса Tesseract OCR.