Изображение Гауссова свертка в области Фурье: работает, а не должно

Question

Изображение Гауссова свертка в области Фурье: работает, а не должно

Проблема в том, что я не могу полностью понять принципы свертки в частотной области.

у меня есть image of size 256x256который я хочу свести с 3x3 gaussian matrix, Это коэффициенты (1/16, 1/8, 1/4):

PlainImage<float> FourierRunner::getGaussMask(int sz)
{
PlainImage<float> G(3,3);
*G.at(0, 0) = 1.0/16; *G.at(0, 1) = 1.0/8; *G.at(0, 2) = 1.0/16;
*G.at(1, 0) = 1.0/8; *G.at(1, 1) = 1.0/4; *G.at(1, 2) = 1.0/8;
*G.at(2, 0) = 1.0/16; *G.at(2, 1) = 1.0/8; *G.at(2, 2) = 1.0/16;
return G;
}

Чтобы получить БПФ как для изображения, так и для ядра фильтра, я их обнуляю. sz_common обозначает расширенный размер. Изображение и ядро перемещены в центр h а также g ComplexImages соответственно, поэтому они дополняются нулями справа, слева, снизу и сверху.

Я читал, что размер должен быть sz_common >= sz+gsz-1 из-за свойства круговой свертки: фильтр может изменять нежелательные значения изображения на границах.
Но это не работает: адекватные результаты только тогда, когда sz_common = sz, когда sz_common = sz+gsz-1 или же sz_common = 2*szпосле IFFT получаю в 2-3 раза меньше свернутого изображения! Зачем?

Также меня смущает, что значения матрицы фильтра должны быть умножены на 256, как значения пикселей: другие вопросы по SO содержат код Matlab без такой нормализации. Как и в предыдущем случае, без такого умножения это работает плохо: я получаю черное изображение. Зачем?

// fft_in смещено изображение Фурье с центром в [sz/2;sz/2]

void FourierRunner::convolveImage(ComplexImage& fft_in)
{
int sz = 256; // equal to fft_in.width()

// Get original complex image (backward fft_in)
ComplexImage original_complex = fft_in;
fft2d_backward(fft_in, original_complex);

int gsz = 3;
PlainImage<float> filter = getGaussMask(gsz);
ComplexImage filter_complex = ComplexImage::fromFloat(filter);

int sz_common = pow2ceil(sz); // should be sz+gsz-1 ???

ComplexImage h = ComplexImage::zeros(sz_common,sz_common);
ComplexImage g = ComplexImage::zeros(sz_common,sz_common);

copyImageToCenter(h, original_complex);
copyImageToCenter(g, filter_complex);

LOOP_2D(sz_common, sz_common) g.setPoint(x, y, g.at(x, y)*256);

fft2d_forward(g, g);
fft2d_forward(h, h);
fft2d_fft_shift(g);

// CONVOLVE
LOOP_2D(sz_common,sz_common) h.setPoint(x, y, h.at(x, y)*g.at(x, y));

copyImageToCenter(fft_in, h);
fft2d_backward(fft_in, fft_in);
fft2d_fft_shift(fft_in);

// TEST DIFFERENCE BTW DOMAINS
PlainImage<float> frequency_res(sz,sz);
writeComplexToPlainImage(fft_in, frequency_res);

fft2d_forward(fft_in, fft_in);
}

Я попытался обнулить изображение справа и снизу так, чтобы меньшее изображение копировалось в начало большего, но оно также не работает.
Я написал свертку в пространственной области, чтобы сравнить результаты, результаты размытия частоты почти то же, что и в пространственной области (средняя ошибка между пикселями равна 5), только когда sz_common = sz,

Итак, не могли бы вы объяснить явления заполнения нуля и нормализации для этого случая? Заранее спасибо.

0

c++convolution fft gaussian image-processing

Решение

Другие решения

Источник

Accepted Answer

Свертка в пространственной области эквивалентна умножению в области Фурье.

Это правда для непрерывных функций, которые определены везде.
Однако на практике у нас есть дискретные сигналы и ядра свертки.
Которые требуют более бережного отношения.

Если у вас есть изображение размером M x N и Ядро размером MM x NN, если вы примените к ним DFT (FFT — эффективный способ вычисления DFT), вы получите функции размера M x N и MM x NN соответственно.
Более того, в приведенной выше теореме об умножении на эквивалентность требуется умножить одни и те же частоты друг на друга.

Поскольку практически Ядро намного меньше, чем изображение, обычно оно дополняется нулями до размера изображения.
Теперь, применяя ДПФ, вы получите матрицы одинакового размера M x N и сможете их умножить.
Тем не менее, это будет эквивалентно круговой свертке между изображением и ядром.

Чтобы применить линейную свертку, вы должны сделать их обоих размером (M + MM — 1) x (N + NN — 1).
Обычно это делается путем применения граничного условия «Репликация» к изображению и заполнения нуля ядра.

Наслаждаться…

Постскриптум
Не могли бы вы поддержать новое Предложение сообщества для SE на — http://area51.stackexchange.com/proposals/86832/.
Нам нужно больше людей, чтобы следить, вопросы для голосования с менее чем 10 голосами и больше вопросов, которые нужно задать.

Благодарю вас.

2