Гистограмма ориентированных градиентов — объяснение

Как я могу объяснить Гистограмма ориентированных градиентов алгоритм для дилетанта?

1

Решение

Нахождение «градиента» пикселя — это нахождение ребра, проходящего через этот пиксель, ориентация этого egde и насколько видим этот край.

Поскольку мы учитываем направление ребер, мы говорим «ориентированные градиенты».

«Гистограмма» подсчитывает, сколько пикселей имеют ребро с определенной ориентацией. Пиксели с видимыми краями имеют большее значение, чем пиксели с мягкими краями.

Например, если у нас есть квадрат на изображении, мы увидим, что HOG имеет много пикселей, подсчитанных в вертикальном направлении, и такое же количество пикселей, подсчитанных в горизонтальном направлении, ни один пиксель не будет подсчитан в диагональных направлениях. Если бы прямоугольник лежал ровно, в горизонтальном направлении было бы больше пикселей, чем в вертикальном, потому что горизонтальные края длиннее. Если бы у нас был ромб, мы бы посчитали пиксели с диагональными краями. Таким образом, вы можете распознавать фигуры, просто сравнивая гистограммы (сколько пикселей имеют ребра в каждом направлении).

Если нам нужно найти квадраты (или лица, или людей, или что-то еще) определенного размера, мы делим изображение на блоки по размеру квадратов, которые мы хотим найти, и сравниваем полученный нами HOG с HOG того, что мы ищем.

9

Другие решения

я нашел лекция д-ра Сильвио о HoG быть чрезвычайно эффективным в объяснении концепции. Я привык к этому, когда учился сам, а также для объяснения другим, и каждый раз это работало очень хорошо. НТН

PS — Авторские права на слайды принадлежат Доктор Сильвио и его группа.

1

По вопросам рекламы [email protected]