Ошибка динамического параллелизма CUDA: LNK2001

Question

Ошибка динамического параллелизма CUDA: LNK2001

Хорошо, я переключился с Python на C ++ в VS2012, чтобы еще раз запустить этот проект. Я столкнулся с большим количеством препятствий и головных болей, узнавая все подробности этого. Вот мой последний, самый расстраивающий и ошибка компиляции, которая идет с этим.

1>  C:\Users\Karsten Chu\New Google Drive\Research\Visual Studio 2012\Projects\Dynamic Parallelism Test\Dynamic Parallelism Test>"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\bin\nvcc.exe" -dlink -o "x64\Debug\Dynamic Parallelism Test.device-link.obj" -Xcompiler "/EHsc /W3 /nologo /Od /Zi /RTC1 /MDd  " -L"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\lib\x64" cuda.lib cudart.lib kernel32.lib user32.lib gdi32.lib winspool.lib comdlg32.lib advapi32.lib shell32.lib ole32.lib oleaut32.lib uuid.lib odbc32.lib odbccp32.lib -lcudadevrt  -gencode=arch=compute_35,code=sm_35 -G --machine 64 "x64\Debug\CUDA Test 2.cu.obj" "x64\Debug\CUDA Test.cu.obj"1>Dynamic Parallelism Test.device-link.obj : error LNK2001: unresolved external symbol __fatbinwrap_54_tmpxft_00000634_00000000_8_cuda_device_runtime_cpp1_ii_5f6993ef
1>C:\Users\Karsten Chu\New Google Drive\Research\Visual Studio 2012\Projects\Dynamic Parallelism Test\x64\Debug\Dynamic Parallelism Test.exe : fatal error LNK1120: 1 unresolved externals
========== Build: 0 succeeded, 1 failed, 0 up-to-date, 0 skipped ==========

И мой код.

#include <cuda.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
#include <stdio.h>
#include <iostream>
using namespace std;

__global__ void rkf5(double*, int*);
__global__ void k1(double*);

int main2(int argc, char** argv)
{
const int max_length = 5;
double concs[max_length];
for (int i=0; i<max_length; i++)
{
concs[i]=0;
//std::cout<<concs[i];
}

double *d_concs;
int *d_max_length;
size_t size_concs = sizeof(concs);
size_t size_max_length = sizeof(max_length);
cudaMalloc((void**)&d_concs, size_concs);
cudaMemcpy(d_concs, concs, size_concs, cudaMemcpyHostToDevice);
cudaMalloc((void**)&d_max_length, size_max_length);
cudaMemcpy(d_concs, concs, size_concs, cudaMemcpyHostToDevice);
rkf5<<<1,max_length>>>(d_concs, d_max_length);
cudaMemcpy(concs, d_concs, size_concs, cudaMemcpyDeviceToHost);

for (int i=0; i<max_length; i++)
{
std::cout<<concs[i];
}
return 0;
}

__global__ void rkf5(double* concs, int* max_length)
{
int idx = blockIdx.x * blockDim.x + threadIdx.x;
concs[idx]=idx;
//dim3 threads = dim3(max_length);
k1<<< 1, *max_length >>>(concs);
}
__global__ void k1(double* concs)
{
int idx = blockIdx.x * blockDim.x + threadIdx.x;
concs[idx]=0;
}

Пожалуйста, помогите мне здесь, я потратил так много времени, погугляя эту проблему, и у каждого найденного мной решения нет опубликованного решения.

0

c++cuda nvcc visual-studio-2012

Решение

Другие решения

Я успешно скомпилировал и запустил ваш код:

используя процедуру в Использование динамического параллелизма CUDA в Visual Studio 2010;
изменения main2 в main;

Программа выводит 0123 🙂

3

Источник

Accepted Answer

Ваша командная строка для компиляции и компоновки:

nvcc.exe -dlink -o "x64\Debug\Dynamic Parallelism Test.device-link.obj"-Xcompiler "/EHsc /W3 /nologo /Od /Zi /RTC1 /MDd  "-L"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\lib\x64"cuda.lib cudart.lib kernel32.lib user32.lib gdi32.lib winspool.lib
comdlg32.lib advapi32.lib shell32.lib ole32.lib oleaut32.lib uuid.lib
odbc32.lib odbccp32.lib -lcudadevrt -gencode=arch=compute_35,code=sm_35 -G
--machine 64 "x64\Debug\CUDA Test 2.cu.obj" "x64\Debug\CUDA Test.cu.obj"

Вы пытаетесь создать ссылку на стиль cudadevrt linux (-lcudadevrt). Это не будет работать в Windows, вызванный компоновщик имеет форму VS. добавлять cudadevrt.lib на ваш вход компоновщика, как cudart.lib,

3