Как я могу объяснить Гистограмма ориентированных градиентов алгоритм для дилетанта?
Нахождение «градиента» пикселя — это нахождение ребра, проходящего через этот пиксель, ориентация этого egde и насколько видим этот край.
Поскольку мы учитываем направление ребер, мы говорим «ориентированные градиенты».
«Гистограмма» подсчитывает, сколько пикселей имеют ребро с определенной ориентацией. Пиксели с видимыми краями имеют большее значение, чем пиксели с мягкими краями.
Например, если у нас есть квадрат на изображении, мы увидим, что HOG имеет много пикселей, подсчитанных в вертикальном направлении, и такое же количество пикселей, подсчитанных в горизонтальном направлении, ни один пиксель не будет подсчитан в диагональных направлениях. Если бы прямоугольник лежал ровно, в горизонтальном направлении было бы больше пикселей, чем в вертикальном, потому что горизонтальные края длиннее. Если бы у нас был ромб, мы бы посчитали пиксели с диагональными краями. Таким образом, вы можете распознавать фигуры, просто сравнивая гистограммы (сколько пикселей имеют ребра в каждом направлении).
Если нам нужно найти квадраты (или лица, или людей, или что-то еще) определенного размера, мы делим изображение на блоки по размеру квадратов, которые мы хотим найти, и сравниваем полученный нами HOG с HOG того, что мы ищем.
я нашел лекция д-ра Сильвио о HoG быть чрезвычайно эффективным в объяснении концепции. Я привык к этому, когда учился сам, а также для объяснения другим, и каждый раз это работало очень хорошо. НТН
PS — Авторские права на слайды принадлежат Доктор Сильвио и его группа.