Я пишу собственный Tensorflow op. Мне нужно отправить пользовательскую структуру данных (созданную на процессоре) в графический процессор для использования в ядре CUDA. Тем не менее, я понимаю, что с Tensorflow, управляющим памятью, только Tensor может быть выделен динамически, правильно? Если так:
а) Как я могу выделить временный тензор на ЦП, в который я могу записывать данные из моей пользовательской структуры данных?
б) Как я могу записать этот тензор в графический процессор для использования с ядром CUDA?
я вижу allocate_temp
с помощью AllocatorAttributes
но документация не существует.
В основном мне нужен эквивалент Caffe mutable_cpu_data
а также mutable_gpu_data
,
Задача ещё не решена.
Других решений пока нет …