Разработчик, с которым я работаю, разрабатывает программу, которая анализирует изображения тротуара, чтобы найти трещины в тротуаре. Для каждой трещины, обнаруженной его программой, она создает запись в файле, которая сообщает мне, какие пиксели составляют эту трещину. Однако есть две проблемы с его программным обеспечением:
1) Он производит несколько ложных срабатываний
2) Если он находит трещину, он находит только небольшие его части и обозначает, что эти секции являются отдельными трещинами.
Моя задача - написать программное обеспечение, которое будет читать эти данные, анализировать их и рассказывать о различиях между ложными срабатываниями и фактическими трещинами. Мне также необходимо определить, как сгруппировать все небольшие участки трещины как один.
Я пробовал различные способы фильтрации данных для устранения ложных срабатываний и с ограниченным успехом использовал нейронные сети для объединения трещин. Я понимаю, что будет ошибка, но на данный момент ошибок слишком много. Есть ли у кого-нибудь идеи для эксперта, не являющегося специалистом по ИИ, в отношении наилучшего способа выполнить мою задачу или узнать больше об этом? Какие книги я должен прочитать или какие классы я должен взять?
ИЗМЕНИТЬ. Мой вопрос - это больше о том, как заметить шаблоны в данных моих коллег и идентифицировать эти шаблоны как реальные трещины. Это логика более высокого уровня, с которой я связан, не столько логика низкого уровня.
РЕДАКТИРОВАТЬ Во всех действиях для получения точного представления данных, с которыми я работаю, потребуется приблизительно 20 образцовых изображений. Это сильно меняется. Но здесь у меня есть образец , здесь и здесь. Эти изображения уже обработаны процессом моего коллеги. Красные, синие и зеленые данные - это то, что я должен классифицировать (красный означает тёмную трещину, синие - светлую трещину, а зеленый - широкую/герметичную трещину).