Я работаю над программой на C ++, которая генерирует и компилирует код CUDA во время выполнения, используя nvrtc
, Код CUDA, который я хочу сгенерировать, зависит от некоторых параметров функции в C ++. Каждый раз, когда я изменяю параметр, компиляция занимает много времени, обычно более 1 часа. Но когда я изменяю параметр обратно, он компилируется за считанные секунды. Кто-нибудь знает, существует ли какой-то «кеш» для компиляции во время выполнения CUDA? Если да, где я могу их найти и можно ли их где-то хранить, чтобы не было необходимости компилировать код с нуля, если код уже был скомпилирован раньше?
Спасибо!
Задача ещё не решена.
Других решений пока нет …