В настоящее время я пытаюсь перевести алгоритм обнаружения изображений Python в C ++ (чтобы использовать его в приложении для смартфонов) с использованием OpenCV.
У меня есть похожие результаты в определенной точке, где два алгоритма, кажется, расходятся из-за накопления небольших различий в изображениях: я применяю некоторые преобразования к изображению, но число десятичных цифр в Python намного больше, чем в C ++ (где я использую матрицы CV_64FC1), поэтому я получаю все больше и больше разных результатов после некоторых итераций …
Есть ли у вас идеи о том, как преодолеть эту проблему?
Заранее спасибо 🙂
РЕДАКТИРОВАТЬ: вот код, который дает другой результат в Python и C ++
void conv2(const Mat &img, const Mat& kernel, Mat& dest) {
Mat source = img;
Point anchor(kernel.cols - kernel.cols/2 - 1, kernel.rows - kernel.rows/2 - 1);
flip(kernel, kernel, 0);
filter2D(source, dest, -1, kernel, anchor);
}
void myFunc() {
Mat im = imread("3.png", IMREAD_GRAYSCALE);
im.convertTo(im, CV_64F);
int rows = im.rows;
int cols = im.cols;
int sze = 7;
Mat gauss = getGaussianKernel(sze, 1);
Mat f = gauss * gauss.t();
Mat fx, fy;
Sobel(f, fx, -1, 1, 0);
Sobel(f, fy, -1, 0, 1);
Mat Gx, Gy, Gxx, Gyy, Gxy;
filter2D(im, Gx, -1, fx);
filter2D(im, Gy, -1, fy);
pow(Gx, 2, Gxx);
pow(Gy, 2, Gyy);
Gxy = Gx.mul(Gy);
gauss = getGaussianKernel(sze, 38);
f = gauss * gauss.t();
conv2(Gxx, f, Gxx);
conv2(Gyy, f, Gyy);
conv2(Gxy, f, Gxy);
Gxy *= 2;
Mat Gxx_minus_Gyy = Gxx - Gyy;
Mat Gxy_squared, Gxx_minus_Gyy_squared;
pow(Gxy, 2, Gxy_squared);
pow(Gxx_minus_Gyy, 2, Gxx_minus_Gyy_squared);
Mat denom;
sqrt(Gxy_squared + Gxx_minus_Gyy_squared, denom);
// denom += numeric_limits<double>::epsilon();
Mat sin2theta = Gxy / denom;
cout.precision(dbl::max_digits10);
cout << fixed << sum(sin2theta) << endl;
exit(1);
}
И питон:
def conv2(img, kernel):
source = img
kernel = cv2.flip(kernel, 0)
rows, cols = kernel.shape
anchor = (int(cols - cols/2 - 1), int(rows - rows/2 - 1))
return cv2.filter2D(source, -1, kernel, anchor=anchor)def myFunc():
im = cv2.imread('3.png', cv2.IMREAD_GRAYSCALE)
im = np.float64(im)
rows, cols = im.shape;
sze = 7
gauss = cv2.getGaussianKernel(sze, 1);
f = gauss * gauss.T;
fx = cv2.Sobel(f, -1, 1, 0)
fy = cv2.Sobel(f, -1, 0, 1)
Gx = cv2.filter2D(im, -1, fx)
Gy = cv2.filter2D(im, -1, fy)
Gxx = cv2.pow(Gx,2);
Gyy = cv2.pow(Gy,2);
Gxy = cv2.multiply(Gx, Gy);
gauss = cv2.getGaussianKernel(sze, 38);
f = gauss * gauss.T;
Gxx = conv2(Gxx, f)
Gyy = conv2(Gyy, f)
Gxy = 2*conv2(Gxy, f)
Gxx_minus_Gyy = Gxx - Gyy
Gxy_squared = cv2.pow(Gxy, 2)
Gxx_minus_Gyy_squared = cv2.pow(Gxx_minus_Gyy, 2)
denom = cv2.sqrt(Gxy_squared + Gxx_minus_Gyy_squared)
# denom += np.finfo(float).eps;
sin2theta = Gxy/denom
print(cv2.sumElems(sin2theta))
exit()
Вызов myFunc () печатает сумму элементов в матрице «sin2theta»: Python выдает 86587.44928456949, а C ++ выдает 86825.05505451805947814, что начинает иметь довольно важное значение.
Задача ещё не решена.
Других решений пока нет …