Прямо сейчас я пытаюсь написать некоторый код Halide, который пробует изображение. В основном я хочу, чтобы каждые 2 на 2 квадрата изображения были уменьшены до одного пикселя, который содержит максимум. Простым примером будет преобразование
1 2 3 4
5 6 7 8
9 0 1 2
4 3 5 6
в
6 8
9 6
Прямо сейчас я пробую что-то вроде (я знаю, что это даст сумму вместо максимума, но это игрушечный пример того же процесса):
Halide::Image<uint8_t> input = load<uint8_t>("test.png");
Halide::Image<uint8_t> output(input.width() / 2, input.height() / 2, input.channels());
Halide::Func subsample;
Halide::Var c;
for (int i = 0; i < input.height(); i += 2) {
for (int j = 0; j < input.width(); j += 2) {
Halide::RDom r = Halide::RDom(i, 2, j, 2);
subsample(i, j, c) += input(r.x, r.y, c);
}
}
subsample.realize(output);
save(output, "test.png");
Однако этот код работает бесконечно. (Я не уверен почему). Я знаю, что могу использовать Halide :: RDom для представления операции сокращения в некотором диапазоне. Однако ни в одном из примеров я не могу передать переменную в случайный объект домена.
РЕДАКТИРОВАТЬ:
Поиграв с Halide еще немного, я смог построить это:
subsample(x, y, c) = Halide::max(input(2*x,2*y,c),input(2*x+1,2*y,c));
subsample(x, y, c) = Halide::max(subsample(x,y,c),input(2*x,2*y+1,c));
subsample(x, y, c) = Halide::max(subsample(x,y,c),input(2*x+1,2*y+1,c));
Чтобы получить максимальное сокращение 2×2. Однако, когда я помещаю это в цикл, он не будет вызываться, потому что не может быть определен. Есть ли в любом случае это с точки зрения сокращения домена?
Я думаю, что argmax (который является встроенной функцией Halide) может быть использован для того, что вы хотите 🙂
#include "Halide.h"#include <stdio.h>
uint8_t data[16] = {
1, 2, 3, 4,
5, 6, 7, 8,
9, 0, 1, 2,
3, 4, 5, 6
};
using namespace Halide;
int main(int argc, char** argv) {
Halide::Image<uint8_t> input(4, 4);
for(int j = 0; j < 4; j++) {
for(int i = 0; i < 4; i++) {
input(j, i) = data[j*4 + i];
}
}
Halide::Func f, max2x2;
Halide::Var x, y, dx, dy;
Halide::Expr x_ = x * 2;
Halide::Expr y_ = y * 2;
f(x, y, dx, dy) = input(x_ + dx, y_ + dy);
RDom r(0, 2, 0, 2);
max2x2(x, y) = argmax(f(x, y, r.x, r.y))[2];
Halide::Image<uint8_t> output(2, 2);
max2x2.realize(output);
for(int j = 0; j < 2; j++) {
for(int i = 0; i < 2; i++) {
printf("%d ", output(j, i));
}
printf("\n");
}
return 0;
}
Посмотрев больше на Halide, я понял, что могу получить то, что хотел с этим:
Halide::Func subsample;
Halide::Var x, y, c;
Halide::RDom r(0, size, 0, size);
subsample(x, y, c) = input(size * x, size * y, c);
subsample(x, y, c) = Halide::max(input(size*x + r.x, size*y + r.y, c),
subsample(x,y,c));
Я думаю, вы просто хотите гораздо более простое определение чистой функции (без циклов C ++, которые не делают то, что, я думаю, вы ожидаете от них…; без RDoms):
// using Halide::max
subsample(x,y,c) = max( max( input(2*x,2*y ), input(2*x+1,2*y ) ),
max( input(2*x,2*y+1), input(2*x+1,2*y+1) ) );