Как функции HoG представлены графически?

Я реализую функции Histogram of Oriented Gradient из "Гистограммы ориентированных градиентов для обнаружения людей", и я хотел бы визуализировать результат. Все документы по этим функциям используют стандартную визуализацию, но я не могу найти никакого описания того, как они сгенерированы. Я был бы благодарен за объяснение или полезную ссылку.

Ответ 1

Визуализации, которые вы видите в документах, можно интерпретировать следующим образом:

Дескриптор состоит из ячеек M * N, покрывающих окно изображения в сетке. Каждая ячейка представлена гистограммой ориентаций краев, где число дискретизированных ориентаций краев является параметром (обычно 9). Гистограмма ячейки визуализируется "звездой", показывающей силу ориентаций краев в гистограмме: чем сильнее определенная ориентация, тем дольше она относительно других.

Обратите внимание, что существуют различные схемы нормализации: локальные схемы, в которых ячейка нормализована только относительно соседних ячеек (как в исходной работе Далала-Триггса) или глобальных схем, в которых длина ориентации нормирована на все ячейки. Также обратите внимание, что некоторые авторы используют несколько локальных нормализаций на ячейку (например, тот, о котором я говорю ниже), но визуализация показывает только один (или средний из них).

Код Matlab для семенной работы Felzenszwalb et al. визуализирует клетки, рисуя их по изображению, где сила визуализируется интенсивностью края вместо длины. Вы можете найти его в пакете, который они здесь приводят (DPM). Найдите функцию с именем HOGpicture.m

В приведенном ниже примере показана модель велосипеда (от Felzenszwalb и др.) с HoG, состоящая из 7 * 11 клеток, каждая с 8 ориентациями

Ответ 2

Блог под названием Jurgenwiki имеет примерный код (называемый get_hogdescriptor_visu()) для визуализации дескрипторов HOG в OpenCV, Раньше я копировал/вставлял код Jurgenwiki в файл С++, передавал свои функции HOG в get_hogdescriptor_visu(), и визуализация выглядела довольно хорошо. Вот пример:

Одна оговорка кода Jurgenwiki заключается в том, что он ожидает, что вы будете использовать параметры HOGDescriptor() по умолчанию (например, 16x16 блоков, 8x8 ячеек, 9 буферов ориентации). Однако, если вы используете пользовательские параметры в HOGDescriptor, вы можете настроить код Jurgenwiki в соответствии с вашими параметрами HOG.

fooobar.com/questions/274109/... также очень полезно.

Ответ 3

В iccv 2013 опубликован недавно опубликованный документ (HOGles) о визуализации функций HOG, которые могут быть весьма полезными, код доступен здесь http://web.mit.edu/vondrick/ihog/#code

Ответ 4

scikit-image также обеспечивает визуализацию HOG: http://scikit-image.org/docs/dev/auto_examples/plot_hog.html

Ответ 5

Здесь я хочу задать один вопрос, что две последовательности кадров человека, идущего, и мы выставляем HOG каждого изображения, а затем принимаем разницу обоих HOG. Я хочу знать, какую информацию мы получаем в финальной (разностной) визуализации HOG.

Спасибо