Я был под впечатлением training data
дано тренировать SVM
состоял из особенностей изображения, но после читая этот пост опять же training_mat
что дано SVM
в примере только img_mat
сплющенный до 1-мерного.
Так что мой вопрос, когда обучение SVM
, вы даете ему все изображения целиком, строка за строкой, или вы detect
а также extract
особенности, а затем сгладить Mat
что в 1-измерение?
Вы можете извлекать объекты или использовать значения интенсивности пикселей в качестве объектов. В этом примере они сделали последнее. В этом случае вы получите очень много функций, многие из которых могут оказаться бесполезными. Это делает сближение обучения SVM более трудным, но все же может быть возможным. Исходя из моего личного опыта, SVM работает лучше, если вы извлекаете меньшее количество «хороших» функций, которые лучше всего описывают ваши данные. Однако в последние годы было показано, что современные оценщики, такие как глубокие нейронные сети (при использовании вместо SVM), могут работать очень хорошо, используя только значения интенсивности пикселей в качестве признаков. Это устранило необходимость извлечения признаков в методах, которые привели к современным результатам для общедоступных наборов данных (таких как ImageNet)