Я пытался узнать об алгоритмах изменения размера изображения, таких как алгоритмы ближайшего соседа, бикубические и билинейные интерполяции. Я немного изучил математику и сейчас смотрю на существующие реализации, чтобы понять и оценить, как они работают.
Я начал с эта реализация Bi-Cubic Resize я нашел в коде Google, который использует OpenCV, и предоставляет тестовый и пример кода. Я использовал его в качестве отправной точки для моей собственной реализации, которая не использует OpenCV, а просто работает с необработанным растровым изображением, содержащимся в std::vector<unsigned char>
:
std::vector<unsigned char> bicubicresize(const std::vector<unsigned char>& in, std::size_t src_width,
std::size_t src_height, std::size_t dest_width, std::size_t dest_height)
{
std::vector<unsigned char> out(dest_width * dest_height * 3);
const float tx = float(src_width) / dest_width;
const float ty = float(src_height) / dest_height;
const int components = 3;
const int bytes_per_row = src_width * components;
const int components2 = components;
const int bytes_per_row2 = dest_width * components;
int a, b, c, d, index;
unsigned char Ca, Cb, Cc;
unsigned char C[5];
unsigned char d0, d2, d3, a0, a1, a2, a3;
for (int i = 0; i < dest_height; ++i)
{
for (int j = 0; j < dest_width; ++j)
{
const int x = int(tx * j);
const int y = int(ty * i);
const float dx = tx * j - x;
const float dy = ty * i - y;
index = y * bytes_per_row + x * components;
a = y * bytes_per_row + (x + 1) * components;
b = (y + 1) * bytes_per_row + x * components;
c = (y + 1) * bytes_per_row + (x + 1) * components;
for (int k = 0; k < 3; ++k)
{
for (int jj = 0; jj <= 3; ++jj)
{
d0 = in[(y - 1 + jj) * bytes_per_row + (x - 1) * components + k] - in[(y - 1 + jj) * bytes_per_row + (x) * components + k];
d2 = in[(y - 1 + jj) * bytes_per_row + (x + 1) * components + k] - in[(y - 1 + jj) * bytes_per_row + (x) * components + k];
d3 = in[(y - 1 + jj) * bytes_per_row + (x + 2) * components + k] - in[(y - 1 + jj) * bytes_per_row + (x) * components + k];
a0 = in[(y - 1 + jj) * bytes_per_row + (x) * components + k];
a1 = -1.0 / 3 * d0 + d2 - 1.0 / 6 * d3;
a2 = 1.0 / 2 * d0 + 1.0 / 2 * d2;
a3 = -1.0 / 6 * d0 - 1.0 / 2 * d2 + 1.0 / 6 * d3;
C[jj] = a0 + a1 * dx + a2 * dx * dx + a3 * dx * dx * dx;
d0 = C[0] - C[1];
d2 = C[2] - C[1];
d3 = C[3] - C[1];
a0 = C[1];
a1 = -1.0 / 3 * d0 + d2 -1.0 / 6 * d3;
a2 = 1.0 / 2 * d0 + 1.0 / 2 * d2;
a3 = -1.0 / 6 * d0 - 1.0 / 2 * d2 + 1.0 / 6 * d3;
Cc = a0 + a1 * dy + a2 * dy * dy + a3* dy * dy * dy;
out[i * bytes_per_row2 + j * components2 + k] = Cc;
}
}
}
}
return out;
}
Теперь, насколько я понимаю, эта реализация смертельно ущербный, из-за строки:
d0 = in[(y - 1 + jj) * bytes_per_row + (x - 1) * components + k] - in[(y - 1 + jj) * bytes_per_row + (x) * components + k];
Мне кажется, что эта линия всегда получить доступ к индексу массива вне границ, когда y
является 0
, А также y
всегда будет 0
изначально, потому что у инициализируется с y = ty * i
, а также i
переменная итератора, которая начинается с 0
, Так как y
всегда будет начинаться с 0
, выражение (y - 1 + jj) * bytes_per_row + (x - 1) * components + k
(который используется для расчета индекса массива) всегда будет отрицательным. И … очевидно, отрицательный индекс массива недопустим.
Вопрос: Мне кажется, что этот код не может работать. Я как-то не прав?
Один из способов сделать это — определить функцию GetPixel ():
GetPixel(int x, int y, int channel)
{
if (x >= 0 && x <= width-1)
if (y >=0 && y <= height-1)
return QueriedPixelFromImage(x,y,channel);
return 0; // out of bounds
}
Вы замените
d0 = in[(y - 1 + jj) * bytes_per_row + (x - 1) * components + k]
от
d0 = GetPixel(x-1,y-1+jj,k)
Я запустил тестовый код, чтобы убедиться, что ничего не пропустил, но насколько я понимаю, вы действительно правы:
#include <iostream>
int main()
{
int components = 3;
const float tx = 200/50;
const float ty = 200/50 ;
int bytes_per_row = 1000 ;
for (int i = 0; i < 5; ++i)
{
for (int j = 0; j < 5; ++j)
{
const int x = int(tx * j);
const int y = int(ty * i);
for (int k = 0; k < 3; ++k)
{
for (int jj = 0; jj <= 3; ++jj)
{
std::cout << "calc: " << (y - 1 + jj) * bytes_per_row + (x - 1) * components + k << std::endl ;
}
}
}
}
}
Я посмотрел код на сайте, который вы предоставили, и он не выглядит как очень большой проект. Поэтому, возможно, вам следует связаться с сопровождающими проекта и посмотреть, смогут ли они оказать некоторую помощь. На первой странице есть контактный адрес электронной почты http://code.google.com/a/eclipselabs.org/p/bicubic-interpolation-image-processing/