Custom Op: чтение / запись во временные данные графического процессора

Я пишу собственный Tensorflow op. Мне нужно отправить пользовательскую структуру данных (созданную на процессоре) в графический процессор для использования в ядре CUDA. Тем не менее, я понимаю, что с Tensorflow, управляющим памятью, только Tensor может быть выделен динамически, правильно? Если так:

а) Как я могу выделить временный тензор на ЦП, в который я могу записывать данные из моей пользовательской структуры данных?

б) Как я могу записать этот тензор в графический процессор для использования с ядром CUDA?

я вижу allocate_temp с помощью AllocatorAttributes но документация не существует.

В основном мне нужен эквивалент Caffe mutable_cpu_data а также mutable_gpu_data,

1

Решение

Задача ещё не решена.

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]