Я пытаюсь разбить и изменить структуру массива асинхронно с использованием ядра CUDA. memcpy()
не работает внутри ядра, а также cudaMemcpy()
*; Я в недоумении.
Может ли кто-нибудь сказать мне предпочтительный метод для копирования памяти из ядра CUDA?
Стоит отметить, cudaMemcpy(void *to, void *from, size, cudaMemcpyDeviceToDevice)
НЕ будет работать для того, что я пытаюсь сделать, потому что он может быть вызван только из-за ядра и не выполняется асинхронно.