Подтвердить что ты не робот

Поиск текста в изображении

В настоящее время я работаю над проектом, и моя цель - найти текст в изображении. OCR'ing текста еще не намечается. Я хочу в основном получить границы текста внутри изображения. Я использую компонент изображения AForge.Net для манипуляции. Любая помощь в том или ином смысле?

Обновление 2/5/09: С тех пор я пошел по другому маршруту в своем проекте. Однако я попытался получить текст, используя MODI (Microsoft Office Document Imaging). Это позволяет вам OCR-изображение и вытягивать текст с него с легкостью.

4b9b3361

Ответ 1

Это активная область исследований. Будут буквально куча научных статей по этому вопросу. Трудно будет оказать вам помощь, особенно без дополнительных сборок. Вы ищете конкретные типы текста? Шрифты? Только английский? Вы знакомы с академической литературой?

"Обнаружение текста" является стандартной проблемой в любой системе распознавания символов (оптического распознавания символов), и, следовательно, на межсетевых экранах есть много бит кода.

Я мог бы начать перечислять груды ссылок из Google, но я предлагаю вам просто выполнить поиск "обнаружения текста" и начать читать:). Также имеется достаточный пример кода.

Ответ 2

распознавание текста внутри изображения действительно является горячей темой для исследователей в этой области, но только начинает выходить из-под контроля, когда captcha стал "норма" в плане защиты от спам-ботов. Зачем использовать captcha в качестве защиты? так как это было/было очень сложно найти (и прочитать) текст внутри изображения!

Причина, по которой я упоминаю captcha, заключается в том, что наибольшее продвижение * сделано в этой крошечной области, и я думаю, что ваше решение можно было бы найти лучше всего. особенно потому, что на самом деле captcha действительно находит текст (или что-то, что напоминает текст) внутри загроможденного изображения, а затем пытается правильно прочитать буквы.

поэтому, если вы можете найти хороший инструмент для исправления ошибок с открытым исходным кодом, у вас, вероятно, есть все, что вам нужно для продолжения вашего квеста... < ш > Вероятно, вы даже можете выбросить самый деструктивный код, который обрабатывает само распознавание символов, потому что эти OCR используются для чтения искаженного текста, что вам не нужно делать.

*: продвижение с точки зрения видимой, полезной и практической информации для "не-исследователя"

Ответ 3

Если вы согласны с использованием онлайн-API для этого, API http://www.wisetrend.com/wisetrend_ocr_cloud.shtml может выполнять обнаружение текста в дополнение к простому OCR.