Как получить необработанный указатель из матричного формата библиотеки cusp

Мне нужно получить необработанный указатель из формата матрицы библиотеки cusp. Например:

cusp::coo_matrix<int,double,cusp::device_memory> A(3,3,4);

A.values[0] = 1;
A.row_indices[0] = 0;
A.column_indices[0]= 1;

A.values[1] = 2;
A.row_indices[1] = 1;
A.column_indices[1]= 0;

A.values[2] = 3;
A.row_indices[2] = 1;
A.column_indices[2]= 1;

A.values[3] = 4;
A.row_indices[3] = 2;
A.column_indices[3]= 2;

Как я могу получить необработанный указатель на массивы row_indices, column_indices и значений? Мне нужно передать их в мои ядра, и я хотел бы избежать ненужного копирования данных, если это возможно.

0

Решение

Есть несколько способов сделать это. Например, если вы хотите начать с представления необработанных данных устройства вместо представления данных каспа, вы можете использовать методологию в каспе функциональность просмотров.

Если у вас уже есть данные CUSP, и вы хотите преобразовать их в представление необработанных данных, мы можем использовать тот факт, что CASP построен поверх осевая нагрузка. Вот полностью проработанный пример:

$ cat t346.cu
#include <cusp/coo_matrix.h>
#include <cusp/print.h>

template <typename T>
__global__ void my_swap_kernel(T *a, T *b, unsigned size){
int idx = threadIdx.x+blockDim.x*blockIdx.x;
if (idx < size){
T temp = b[idx];
b[idx] = a[idx];
a[idx] = temp;}
}int main(void)
{
// allocate storage for (4,3) matrix with 6 nonzeros
cusp::coo_matrix<int,float,cusp::device_memory> A(4,3,6);

// initialize matrix entries on host
A.row_indices[0] = 0; A.column_indices[0] = 0; A.values[0] = 10;
A.row_indices[1] = 0; A.column_indices[1] = 2; A.values[1] = 20;
A.row_indices[2] = 2; A.column_indices[2] = 2; A.values[2] = 30;
A.row_indices[3] = 3; A.column_indices[3] = 0; A.values[3] = 40;
A.row_indices[4] = 3; A.column_indices[4] = 1; A.values[4] = 50;
A.row_indices[5] = 3; A.column_indices[5] = 2; A.values[5] = 60;
float *val0 = thrust::raw_pointer_cast(&A.values[0]);
float *val3 = thrust::raw_pointer_cast(&A.values[3]);

// A now represents the following matrix
//    [10  0 20]
//    [ 0  0  0]
//    [ 0  0 30]
//    [40 50 60]

// print matrix entries
cusp::print(A);
my_swap_kernel<<<1,3>>>(val0, val3, 3);
cusp::print(A);

return 0;
}

$ nvcc -arch=sm_20 -o t346 t346.cu
$ cuda-memcheck ./t346
========= CUDA-MEMCHECK
sparse matrix <4, 3> with 6 entries
0              0             10
0              2             20
2              2             30
3              0             40
3              1             50
3              2             60
sparse matrix <4, 3> with 6 entries
0              0             40
0              2             50
2              2             60
3              0             10
3              1             20
3              2             30
========= ERROR SUMMARY: 0 errors
$
1

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]